SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 971–980 of 1262 papers

Title	Date	Tasks	Status
Social Learning in Multi Agent Multi Armed Bandits	Oct 4, 2019	Multi-Armed Bandits	—Unverified
Decision Automation for Electric Power Network Recovery	Oct 1, 2019	Decision MakingMulti-Armed Bandits	—Unverified
An Optimal Algorithm for Multiplayer Multi-Armed Bandits	Sep 28, 2019	Multi-Armed Bandits	—Unverified
NeuralUCB: Contextual Bandits with Neural Network-Based Exploration	Sep 25, 2019	Efficient ExplorationMulti-Armed Bandits	—Unverified
Neural Linear Bandits: Overcoming Catastrophic Forgetting through Likelihood Matching	Sep 25, 2019	Efficient ExplorationMulti-Armed Bandits	CodeCode Available
Learning Effective Exploration Strategies For Contextual Bandits	Sep 25, 2019	Imitation LearningLearning-To-Rank	—Unverified
Practical Calculation of Gittins Indices for Multi-armed Bandits	Sep 11, 2019	Multi-Armed Bandits	CodeCode Available
AutoML for Contextual Bandits	Sep 7, 2019	AutoMLFeature Engineering	—Unverified
Smooth Contextual Bandits: Bridging the Parametric and Non-differentiable Regret Regimes	Sep 5, 2019	Multi-Armed Bandits	CodeCode Available
Censored Semi-Bandits: A Framework for Resource Allocation with Censored Feedback	Sep 4, 2019	Multi-Armed Bandits	CodeCode Available

Show:10 25 50

← PrevPage 98 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified