SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 891–900 of 1262 papers

Title	Date	Tasks	Status
Greedy Algorithm almost Dominates in Smoothed Contextual Bandits	May 19, 2020	DiversityMulti-Armed Bandits	—Unverified
Neural Network Retraining for Model Serving	Apr 29, 2020	modelMulti-Armed Bandits	—Unverified
Learning to Rank in the Position Based Model with Bandit Feedback	Apr 27, 2020	Learning-To-RankMulti-Armed Bandits	—Unverified
Thompson Sampling for Linearly Constrained Bandits	Apr 20, 2020	Multi-Armed BanditsThompson Sampling	CodeCode Available
Sequential Batch Learning in Finite-Action Linear Contextual Bandits	Apr 14, 2020	Decision MakingMulti-Armed Bandits	—Unverified
Power Constrained Bandits	Apr 13, 2020	Decision MakingMulti-Armed Bandits	CodeCode Available
Exploration with Limited Memory: Streaming Algorithms for Coin Tossing, Noisy Comparisons, and Multi-Armed Bandits	Apr 9, 2020	Multi-Armed Bandits	—Unverified
Hawkes Process Multi-armed Bandits for Disaster Search and Rescue	Apr 3, 2020	Multi-Armed Bandits	—Unverified
Bypassing the Monster: A Faster and Simpler Optimal Algorithm for Contextual Bandits under Realizability	Mar 28, 2020	Multi-Armed Banditsregression	—Unverified
Optimal No-regret Learning in Repeated First-price Auctions	Mar 22, 2020	Multi-Armed BanditsThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 90 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified