SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 721–730 of 1262 papers

Title	Date	Tasks	Status
Towards Costless Model Selection in Contextual Bandits: A Bias-Variance Perspective	Jun 11, 2021	Model SelectionMulti-Armed Bandits	—Unverified
A Central Limit Theorem, Loss Aversion and Multi-Armed Bandits	Jun 10, 2021	Multi-Armed Bandits	—Unverified
Fixed-Budget Best-Arm Identification in Structured Bandits	Jun 9, 2021	Multi-Armed Bandits	—Unverified
Scale Free Adversarial Multi Armed Bandits	Jun 8, 2021	Multi-Armed Bandits	—Unverified
Cooperative Stochastic Multi-agent Multi-armed Bandits Robust to Adversarial Corruptions	Jun 8, 2021	Multi-Armed BanditsOpen-Ended Question Answering	—Unverified
On Learning to Rank Long Sequences with Contextual Bandits	Jun 7, 2021	Learning-To-RankMulti-Armed Bandits	—Unverified
Multi-facet Contextual Bandits: A Neural Network Perspective	Jun 6, 2021	Multi-Armed BanditsRecommendation Systems	CodeCode Available
Robust Stochastic Linear Contextual Bandits Under Adversarial Attacks	Jun 5, 2021	Multi-Armed BanditsRecommendation Systems	—Unverified
Differentially Private Multi-Armed Bandits in the Shuffle Model	Jun 5, 2021	Multi-Armed Bandits	—Unverified
Fair Exploration via Axiomatic Bargaining	Jun 4, 2021	FairnessMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 73 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified