SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1091–1100 of 1262 papers

Title	Date	Tasks	Status
An Empirical Evaluation of Federated Contextual Bandit Algorithms	Mar 17, 2023	Federated LearningMulti-Armed Bandits	—Unverified
An Empirical Evaluation of Thompson Sampling	Dec 1, 2011	Multi-Armed BanditsThompson Sampling	—Unverified
A New Algorithm for Non-stationary Contextual Bandits: Efficient, Optimal, and Parameter-free	Feb 3, 2019	Multi-Armed Bandits	—Unverified
A New Benchmark for Online Learning with Budget-Balancing Constraints	Mar 19, 2025	Multi-Armed Bandits	—Unverified
An Exploration-free Method for a Linear Stochastic Bandit Driven by a Linear Gaussian Dynamical System	Apr 4, 2025	Hyperparameter OptimizationMulti-Armed Bandits	—Unverified
An Improved Relaxation for Oracle-Efficient Adversarial Contextual Bandits	Oct 29, 2023	Multi-Armed Bandits	—Unverified
An Instance-Dependent Analysis for the Cooperative Multi-Player Multi-Armed Bandit	Nov 8, 2021	Multi-Armed Bandits	—Unverified
An Instrumental Value for Data Production and its Application to Data Pricing	Dec 24, 2024	Decision MakingMulti-Armed Bandits	—Unverified
An Optimal Algorithm for Adversarial Bandits with Arbitrary Delays	Oct 14, 2019	Multi-Armed Bandits	—Unverified
Tsallis-INF: An Optimal Algorithm for Stochastic and Adversarial Bandits	Jul 19, 2018	Multi-Armed BanditsThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 110 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified