SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–710 of 1262 papers

Title	Date	Tasks	Status
Reinforcement Learning for Physical Layer Communications	Jun 22, 2021	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available
BanditMF: Multi-Armed Bandit Based Matrix Factorization Recommender System	Jun 21, 2021	Collaborative FilteringMulti-Armed Bandits	—Unverified
Smooth Sequential Optimisation with Delayed Feedback	Jun 21, 2021	Multi-Armed Bandits	—Unverified
Banker Online Mirror Descent	Jun 16, 2021	Multi-Armed Bandits	—Unverified
Guaranteed Fixed-Confidence Best Arm Identification in Multi-Armed Bandits: Simple Sequential Elimination Algorithms	Jun 12, 2021	Multi-Armed Bandits	—Unverified
Towards Costless Model Selection in Contextual Bandits: A Bias-Variance Perspective	Jun 11, 2021	Model SelectionMulti-Armed Bandits	—Unverified
A Central Limit Theorem, Loss Aversion and Multi-Armed Bandits	Jun 10, 2021	Multi-Armed Bandits	—Unverified
Fixed-Budget Best-Arm Identification in Structured Bandits	Jun 9, 2021	Multi-Armed Bandits	—Unverified
Scale Free Adversarial Multi Armed Bandits	Jun 8, 2021	Multi-Armed Bandits	—Unverified
Cooperative Stochastic Multi-agent Multi-armed Bandits Robust to Adversarial Corruptions	Jun 8, 2021	Multi-Armed BanditsOpen-Ended Question Answering	—Unverified

Show:10 25 50

← PrevPage 71 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified