SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1041–1050 of 1262 papers

Title	Date	Tasks	Status
Quantum contextual bandits and recommender systems for quantum data	Jan 31, 2023	Multi-Armed BanditsRecommendation Systems	—Unverified
Quantum Heavy-tailed Bandits	Jan 23, 2023	Multi-Armed Bandits	—Unverified
Quantum Multi-Armed Bandits and Stochastic Linear Bandits Enjoy Logarithmic Regrets	May 30, 2022	Multi-Armed Banditsreinforcement-learning	—Unverified
Query-Efficient Correlation Clustering with Noisy Oracle	Feb 2, 2024	ClusteringMulti-Armed Bandits	—Unverified
Queue Scheduling with Adversarial Bandit Learning	Mar 3, 2023	Multi-Armed BanditsScheduling	—Unverified
Quick-Draw Bandits: Quickly Optimizing in Nonstationary Environments with Extremely Many Arms	May 30, 2025	Multi-Armed Bandits	—Unverified
Raising Student Completion Rates with Adaptive Curriculum and Contextual Bandits	Jul 28, 2022	Model-based Reinforcement LearningMulti-Armed Bandits	—Unverified
Random Effect Bandits	Jun 23, 2021	Multi-Armed BanditsThompson Sampling	—Unverified
Randomized Allocation with Nonparametric Estimation for Contextual Multi-Armed Bandits with Delayed Rewards	Feb 3, 2019	Multi-Armed Bandits	—Unverified
Randomized Greedy Learning for Non-monotone Stochastic Submodular Maximization Under Full-bandit Feedback	Feb 2, 2023	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 105 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified