SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 831–840 of 1262 papers

Title	Date	Tasks	Status	Hype
Carousel Personalization in Music Streaming Apps with Contextual Bandits	Sep 14, 2020	Multi-Armed Bandits	CodeCode Available	1
VacSIM: Learning Effective Strategies for COVID-19 Vaccine Distribution using Reinforcement Learning	Sep 14, 2020	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available	0
Unifying Clustered and Non-stationary Bandits	Sep 5, 2020	Change DetectionClustering	—Unverified	0
Statistically Robust, Risk-Averse Best Arm Identification in Multi-Armed Bandits	Aug 28, 2020	Multi-Armed Bandits	—Unverified	0
Dynamic Batch Learning in High-Dimensional Sparse Linear Contextual Bandits	Aug 27, 2020	Decision MakingMarketing	—Unverified	0
A Sleeping, Recovering Bandit Algorithm for Optimizing Recurring Notifications	Aug 23, 2020	Multi-Armed Bandits	—Unverified	0
Contextual Bandits for Advertising Budget Allocation	Aug 22, 2020	MarketingMulti-Armed Bandits	—Unverified	0
Offline Contextual Multi-armed Bandits for Mobile Health Interventions: A Case Study on Emotion Regulation	Aug 21, 2020	ManagementMulti-Armed Bandits	—Unverified	0
Using Subjective Logic to Estimate Uncertainty in Multi-Armed Bandit Problems	Aug 17, 2020	Decision MakingMulti-Armed Bandits	CodeCode Available	0
Kernel Methods for Cooperative Multi-Agent Contextual Bandits	Aug 14, 2020	Decision MakingMulti-Armed Bandits	—Unverified	0

Show:10 25 50

← PrevPage 84 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified