SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 1262 papers

Title	Date	Tasks	Status
Batched Nonparametric Bandits via k-Nearest Neighbor UCB	May 15, 2025	Decision MakingMarketing	—Unverified
Near Optimal Best Arm Identification for Clustered Bandits	May 15, 2025	ClusteringComputational Efficiency	—Unverified
Adaptive, Robust and Scalable Bayesian Filtering for Online Learning	May 12, 2025	Continual LearningMulti-Armed Bandits	—Unverified
Navigating the Rashomon Effect: How Personalization Can Help Adjust Interpretable Machine Learning Models to Individual Users	May 11, 2025	Additive modelsInterpretable Machine Learning	—Unverified
Adaptive Budgeted Multi-Armed Bandits for IoT with Dynamic Resource Constraints	May 5, 2025	Multi-Armed Bandits	—Unverified
Preference-centric Bandits: Optimality of Mixtures and Regret-efficient Algorithms	Apr 29, 2025	Multi-Armed BanditsNavigate	—Unverified
Access Probability Optimization in RACH: A Multi-Armed Bandits Approach	Apr 18, 2025	Multi-Armed Bandits	—Unverified
Neural Contextual Bandits Under Delayed Feedback Constraints	Apr 16, 2025	Multi-Armed BanditsRecommendation Systems	—Unverified
On the Problem of Best Arm Retention	Apr 16, 2025	Multi-Armed Bandits	—Unverified
Learning-Based User Association for MmWave Vehicular Networks With Kernelized Contextual Bandits	Apr 15, 2025	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 7 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified