SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 841–850 of 1262 papers

Title	Date	Tasks	Status
Statistically Robust, Risk-Averse Best Arm Identification in Multi-Armed Bandits	Aug 28, 2020	Multi-Armed Bandits	—Unverified
Dynamic Batch Learning in High-Dimensional Sparse Linear Contextual Bandits	Aug 27, 2020	Decision MakingMarketing	—Unverified
A Sleeping, Recovering Bandit Algorithm for Optimizing Recurring Notifications	Aug 23, 2020	Multi-Armed Bandits	—Unverified
Contextual Bandits for Advertising Budget Allocation	Aug 22, 2020	MarketingMulti-Armed Bandits	—Unverified
Offline Contextual Multi-armed Bandits for Mobile Health Interventions: A Case Study on Emotion Regulation	Aug 21, 2020	ManagementMulti-Armed Bandits	—Unverified
Using Subjective Logic to Estimate Uncertainty in Multi-Armed Bandit Problems	Aug 17, 2020	Decision MakingMulti-Armed Bandits	CodeCode Available
Kernel Methods for Cooperative Multi-Agent Contextual Bandits	Aug 14, 2020	Decision MakingMulti-Armed Bandits	—Unverified
Lenient Regret for Multi-Armed Bandits	Aug 10, 2020	Multi-Armed BanditsThompson Sampling	—Unverified
A framework for optimizing COVID-19 testing policy using a Multi Armed Bandit approach	Jul 28, 2020	Decision MakingMulti-Armed Bandits	—Unverified
Greedy Bandits with Sampled Context	Jul 27, 2020	Decision MakingMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 85 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified