SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1211–1220 of 1262 papers

Title	Date	Tasks	Status
Algorithms with Logarithmic or Sublinear Regret for Constrained Contextual Bandits	Apr 27, 2015	Multi-Armed Bandits	—Unverified
Regret vs. Communication: Distributed Stochastic Multi-Armed Bandits and Beyond	Apr 14, 2015	Multi-Armed Bandits	—Unverified
Global Bandits	Mar 29, 2015	Decision MakingInformativeness	—Unverified
Networked Stochastic Multi-Armed Bandits with Combinatorial Strategies	Mar 20, 2015	Multi-Armed Bandits	—Unverified
Doubly Robust Policy Evaluation and Optimization	Mar 10, 2015	Decision MakingMulti-Armed Bandits	—Unverified
Learning to Search Better Than Your Teacher	Feb 8, 2015	Multi-Armed BanditsStructured Prediction	—Unverified
Combinatorial Pure Exploration of Multi-Armed Bandits	Dec 1, 2014	Multi-Armed Bandits	—Unverified
Learning Multiple Tasks in Parallel with a Shared Annotator	Dec 1, 2014	Binary ClassificationDocument Classification	—Unverified
Nonstochastic Multi-Armed Bandits with Graph-Structured Feedback	Sep 30, 2014	Multi-Armed Bandits	—Unverified
On Minimax Optimal Offline Policy Evaluation	Sep 12, 2014	Multi-Armed BanditsOff-policy evaluation	—Unverified

Show:10 25 50

← PrevPage 122 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified