SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 811–820 of 1262 papers

Title	Date	Tasks	Status
Modeling Human Decision-making in Generalized Gaussian Multi-armed Bandits	Jul 23, 2013	Bayesian InferenceDecision Making	—Unverified
Modelling Cournot Games as Multi-agent Multi-armed Bandits	Jan 1, 2022	Multi-Armed Bandits	—Unverified
Model selection for behavioral learning data and applications to contextual bandits	Feb 18, 2025	Model SelectionMulti-Armed Bandits	—Unverified
Model Selection for Generic Contextual Bandits	Jul 7, 2021	modelModel Selection	—Unverified
Model Selection in Contextual Stochastic Bandit Problems	Mar 3, 2020	modelModel Selection	—Unverified
Model Selection in Reinforcement Learning with General Function Approximations	Jul 6, 2022	Model SelectionMulti-Armed Bandits	—Unverified
Modified Meta-Thompson Sampling for Linear Bandits and Its Bayes Regret Analysis	Sep 10, 2024	Meta-LearningMulti-Armed Bandits	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified
More Robust Doubly Robust Off-policy Evaluation	Feb 10, 2018	Multi-Armed BanditsOff-policy evaluation	—Unverified
Mortal Multi-Armed Bandits	Dec 1, 2008	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 82 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified