SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1181–1190 of 1262 papers

Title	Date	Tasks	Status
Making Contextual Decisions with Low Technical Debt	Jun 13, 2016	Multi-Armed Bandits	—Unverified
Improved Regret Bounds for Oracle-Based Adversarial Contextual Bandits	Jun 1, 2016	Multi-Armed Bandits	—Unverified
Contextual Bandits with Latent Confounders: An NMF Approach	Jun 1, 2016	Matrix CompletionMulti-Armed Bandits	—Unverified
Open Problem: Best Arm Identification: Almost Instance-Wise Optimality and the Gap Entropy Conjecture	May 27, 2016	Multi-Armed Bandits	—Unverified
Fairness in Learning: Classic and Contextual Bandits	May 23, 2016	FairnessMulti-Armed Bandits	—Unverified
Graph Clustering Bandits for Recommendation	May 2, 2016	ClusteringGraph Clustering	—Unverified
Stochastic Contextual Bandits with Known Reward Functions	Apr 30, 2016	Decision MakingMulti-Armed Bandits	—Unverified
Latent Contextual Bandits and their Application to Personalized Recommendations for New Users	Apr 22, 2016	Multi-Armed Bandits	—Unverified
Cascading Bandits for Large-Scale Recommendation Problems	Mar 17, 2016	Multi-Armed BanditsRecommendation Systems	CodeCode Available
PAC Reinforcement Learning with Rich Observations	Feb 8, 2016	Decision MakingMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 119 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified