SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–910 of 1262 papers

Title	Date	Tasks	Status
Slowly Changing Adversarial Bandit Algorithms are Efficient for Discounted MDPs	May 18, 2022	Multi-Armed Banditsreinforcement-learning	—Unverified
Small-loss bounds for online learning with partial information	Nov 9, 2017	Multi-Armed Bandits	—Unverified
Small Total-Cost Constraints in Contextual Bandits with Knapsacks, with Application to Fairness	May 25, 2023	FairnessMulti-Armed Bandits	—Unverified
SmartChoices: Augmenting Software with Learned Implementations	Apr 12, 2023	Multi-Armed BanditsPhilosophy	—Unverified
Smoothed Online Learning is as Easy as Statistical Learning	Feb 9, 2022	Learning TheoryMulti-Armed Bandits	—Unverified
Smooth Sequential Optimisation with Delayed Feedback	Jun 21, 2021	Multi-Armed Bandits	—Unverified
Social Learning in Multi Agent Multi Armed Bandits	Oct 4, 2019	Multi-Armed Bandits	—Unverified
Sparse Additive Contextual Bandits: A Nonparametric Approach for Online Decision-making with High-dimensional Covariates	Mar 21, 2025	Decision MakingMulti-Armed Bandits	—Unverified
Sparse Nonparametric Contextual Bandits	Mar 20, 2025	Multi-Armed BanditsThompson Sampling	—Unverified
Sparsity, variance and curvature in multi-armed bandits	Nov 3, 2017	Generalization BoundsLearning Theory	—Unverified

Show:10 25 50

← PrevPage 91 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified