SOTAVerified|Agents Browse Leaderboard About Blog

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 1262 papers

Title	Date	Tasks	Status
Neural Contextual Bandits Under Delayed Feedback Constraints	Apr 16, 2025	Multi-Armed BanditsRecommendation Systems	—Unverified
On the Problem of Best Arm Retention	Apr 16, 2025	Multi-Armed Bandits	—Unverified
Learning-Based User Association for MmWave Vehicular Networks With Kernelized Contextual Bandits	Apr 15, 2025	Multi-Armed Bandits	—Unverified
Towards More Efficient, Robust, Instance-adaptive, and Generalizable Sequential Decision making	Apr 12, 2025	Decision MakingDecision Making Under Uncertainty	—Unverified
A Classification View on Meta Learning Bandits	Apr 6, 2025	ClassificationMeta-Learning	—Unverified
An Exploration-free Method for a Linear Stochastic Bandit Driven by a Linear Gaussian Dynamical System	Apr 4, 2025	Hyperparameter OptimizationMulti-Armed Bandits	—Unverified
Antithetic Sampling for Top-k Shapley Identification	Apr 2, 2025	Multi-Armed Bandits	CodeCode Available
Efficient Near-Optimal Algorithm for Online Shortest Paths in Directed Acyclic Graphs with Bandit Feedback Against Adaptive Adversaries	Apr 1, 2025	Multi-Armed Bandits	—Unverified
Reinforcement Learning for Machine Learning Model Deployment: Evaluating Multi-Armed Bandits in ML Ops Environments	Mar 28, 2025	ManagementModel Selection	—Unverified
MultiScale Contextual Bandits for Long Term Objectives	Mar 22, 2025	Multi-Armed BanditsRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 4 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified