SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 891–900 of 1262 papers

Title	Date	Tasks	Status
Sequential Design for Ranking Response Surfaces	Sep 3, 2015	Experimental DesignMulti-Armed Bandits	—Unverified
Sequential Monte Carlo Bandits	Oct 4, 2013	Multi-Armed Bandits	—Unverified
Settling the Communication Complexity for Distributed Offline Reinforcement Learning	Feb 10, 2022	Multi-Armed BanditsOffline RL	—Unverified
SHAP@k:Efficient and Probably Approximately Correct (PAC) Identification of Top-k Features	Jul 10, 2023	Feature ImportanceMulti-Armed Bandits	—Unverified
Sharp Analysis for KL-Regularized Contextual Bandits and RLHF	Nov 7, 2024	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified
Sharp Deviations Bounds for Dirichlet Weighted Sums with Application to analysis of Bayesian algorithms	Apr 6, 2023	Multi-Armed BanditsThompson Sampling	—Unverified
Shuffle Private Linear Contextual Bandits	Feb 11, 2022	Multi-Armed Bandits	—Unverified
Simple Regret Minimization for Contextual Bandits	Oct 17, 2018	Multi-Armed Bandits	—Unverified
Simultaneously Learning Stochastic and Adversarial Episodic MDPs with Known Transition	Jun 10, 2020	Multi-Armed Bandits	—Unverified
Skyline Identification in Multi-Armed Bandits	Nov 12, 2017	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 90 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified