SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 711–720 of 1262 papers

Title	Date	Tasks	Status	Hype
Generalized Linear Bandits with Local Differential Privacy	Jun 7, 2021	Decision MakingMulti-Armed Bandits	CodeCode Available	1
On Learning to Rank Long Sequences with Contextual Bandits	Jun 7, 2021	Learning-To-RankMulti-Armed Bandits	—Unverified	0
Multi-facet Contextual Bandits: A Neural Network Perspective	Jun 6, 2021	Multi-Armed BanditsRecommendation Systems	CodeCode Available	0
Differentially Private Multi-Armed Bandits in the Shuffle Model	Jun 5, 2021	Multi-Armed Bandits	—Unverified	0
Robust Stochastic Linear Contextual Bandits Under Adversarial Attacks	Jun 5, 2021	Multi-Armed BanditsRecommendation Systems	—Unverified	0
Fair Exploration via Axiomatic Bargaining	Jun 4, 2021	FairnessMulti-Armed Bandits	—Unverified	0
Optimal Rates of (Locally) Differentially Private Heavy-tailed Multi-Armed Bandits	Jun 4, 2021	Multi-Armed Bandits	—Unverified	0
Stochastic Multi-Armed Bandits with Unrestricted Delay Distributions	Jun 4, 2021	Multi-Armed Bandits	—Unverified	0
Off-Policy Evaluation via Adaptive Weighting with Data from Contextual Bandits	Jun 3, 2021	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	1
Addressing the Long-term Impact of ML Decisions via Policy Regret	Jun 2, 2021	Multi-Armed Bandits	CodeCode Available	0

Show:10 25 50

← PrevPage 72 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified