SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 381–390 of 1262 papers

Title	Date	Tasks	Status
Distributionally Robust Policy Evaluation and Learning in Offline Contextual Bandits	Jan 1, 2020	Multi-Armed Bandits	—Unverified
Distributionally Robust Batch Contextual Bandits	Jun 10, 2020	Multi-Armed Bandits	—Unverified
Distribution-dependent and Time-uniform Bounds for Piecewise i.i.d Bandits	May 30, 2019	Multi-Armed Bandits	—Unverified
Distribution-Dependent Rates for Multi-Distribution Learning	Dec 20, 2023	Multi-Armed Bandits	—Unverified
Diversify and Conquer: Bandits and Diversity for an Enhanced E-commerce Homepage Experience	Sep 25, 2023	DiversityMulti-Armed Bandits	—Unverified
Diversity-Based Recruitment in Crowdsensing By Combinatorial Multi-Armed Bandits	Dec 25, 2023	DiversityMulti-Armed Bandits	—Unverified
Diversity-Driven Selection of Exploration Strategies in Multi-Armed Bandits	Aug 23, 2018	DiversityMulti-Armed Bandits	—Unverified
DOPL: Direct Online Preference Learning for Restless Bandits with Preference Feedback	Oct 7, 2024	Multi-Armed BanditsSequential Decision Making	—Unverified
Double Doubly Robust Thompson Sampling for Generalized Linear Contextual Bandits	Sep 15, 2022	Multi-Armed BanditsThompson Sampling	—Unverified
Adapting to Misspecification in Contextual Bandits	Jul 12, 2021	Multi-Armed Banditsregression	—Unverified

Show:10 25 50

← PrevPage 39 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified