SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–560 of 1262 papers

Title	Date	Tasks	Status
Contextual Bandits for Unbounded Context Distributions	Aug 19, 2024	Decision MakingMulti-Armed Bandits	—Unverified
Heterogeneous Multi-Player Multi-Armed Bandits Robust To Adversarial Attacks	Jan 21, 2025	Adversarial AttackAll	—Unverified
Contextual Bandits in a Survey Experiment on Charitable Giving: Within-Experiment Outcomes versus Policy Learning	Nov 22, 2022	Multi-Armed Bandits	—Unverified
From Dirichlet to Rubin: Optimistic Exploration in RL without Bonuses	May 16, 2022	Multi-Armed Bandits	—Unverified
From Bandits to Experts: On the Value of Side-Observations	Dec 1, 2011	Multi-Armed Bandits	—Unverified
Hierarchical Optimistic Region Selection driven by Curiosity	Dec 1, 2012	Active LearningMulti-Armed Bandits	—Unverified
High-dimensional Linear Bandits with Knapsacks	Nov 2, 2023	Multi-Armed Bandits	—Unverified
High-dimensional Nonparametric Contextual Bandit Problem	May 20, 2025	Decision MakingMulti-Armed Bandits	—Unverified
High Probability Bound for Cross-Learning Contextual Bandits with Unknown Context Distributions	Oct 5, 2024	Multi-Armed Bandits	—Unverified
Confidence-Budget Matching for Sequential Budgeted Learning	Feb 5, 2021	Decision MakingDecision Making Under Uncertainty	—Unverified

Show:10 25 50

← PrevPage 56 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified