SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1210 of 1262 papers

Title	Date	Tasks	Status
Classical Bandit Algorithms for Entanglement Detection in Parameterized Qubit States	Jun 28, 2024	Multi-Armed Bandits	—Unverified
Clustered Linear Contextual Bandits with Knapsacks	Aug 21, 2023	EconometricsMulti-Armed Bandits	—Unverified
COBRA: Contextual Bandit Algorithm for Ensuring Truthful Strategic Agents	May 29, 2025	Multi-Armed Bandits	—Unverified
Parallel Best Arm Identification in Heterogeneous Environments	Jul 16, 2022	Multi-Armed Bandits	—Unverified
Collaborative Learning with Limited Interaction: Tight Bounds for Distributed Exploration in Multi-Armed Bandits	Apr 5, 2019	Multi-Armed Bandits	—Unverified
Collaborative Min-Max Regret in Grouped Multi-Armed Bandits	Jun 12, 2025	Multi-Armed Bandits	—Unverified
Collaborative Multi-Agent Heterogeneous Multi-Armed Bandits	May 30, 2023	Multi-Armed Bandits	—Unverified
Communication-Efficient Collaborative Regret Minimization in Multi-Armed Bandits	Jan 26, 2023	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified
Top-k Combinatorial Bandits with Full-Bandit Feedback	May 28, 2019	Multi-Armed Bandits	—Unverified
Bayesian Analysis of Combinatorial Gaussian Process Bandits	Dec 20, 2023	Bayesian InferenceInformativeness	—Unverified

Show:10 25 50

← PrevPage 121 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified