SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 921–930 of 1262 papers

Title	Date	Tasks	Status
Residual Bootstrap Exploration for Bandit Algorithms	Feb 19, 2020	Computational EfficiencyMulti-Armed Bandits	—Unverified
On conditional versus marginal bias in multi-armed bandits	Feb 19, 2020	Multi-Armed Bandits	—Unverified
Adaptive Estimator Selection for Off-Policy Evaluation	Feb 18, 2020	Multi-Armed BanditsOff-policy evaluation	CodeCode Available
Coordination without communication: optimal regret in two players multi-armed bandits	Feb 14, 2020	Multi-Armed BanditsVocal Bursts Valence Prediction	—Unverified
Tight Lower Bounds for Combinatorial Multi-Armed Bandits	Feb 13, 2020	Decision MakingMulti-Armed Bandits	—Unverified
A General Theory of the Stochastic Linear Bandit and Its Applications	Feb 12, 2020	Multi-Armed BanditsThompson Sampling	—Unverified
Beyond UCB: Optimal and Efficient Contextual Bandits with Regression Oracles	Feb 12, 2020	Multi-Armed Banditsregression	—Unverified
Adversarial Attacks on Linear Contextual Bandits	Feb 10, 2020	Multi-Armed BanditsRecommendation Systems	—Unverified
Inference for Batched Bandits	Feb 8, 2020	Multi-Armed Bandits	—Unverified
Selfish Robustness and Equilibria in Multi-Player Bandits	Feb 4, 2020	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 93 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified