SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 1262 papers

Title	Date	Tasks	Status	Score
Efficient Kernel UCB for Contextual Bandits	Feb 11, 2022	Computational EfficiencyMulti-Armed Bandits	CodeCode Available	5
Empirical Likelihood for Contextual Bandits	Jun 7, 2019	Multi-Armed Bandits	CodeCode Available	5
Causally Abstracted Multi-armed Bandits	Apr 26, 2024	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Evolutionary Multi-Armed Bandits with Genetic Thompson Sampling	Apr 26, 2022	Decision MakingEvolutionary Algorithms	CodeCode Available	5
From Complexity to Simplicity: Adaptive ES-Active Subspaces for Blackbox Optimization	Mar 7, 2019	compressed sensingMulti-Armed Bandits	CodeCode Available	5
Falcon: Fair Active Learning using Multi-armed Bandits	Jan 23, 2024	Active LearningAttribute	CodeCode Available	5
Federated Multi-armed Bandits with Personalization	Feb 25, 2021	Federated LearningMulti-Armed Bandits	CodeCode Available	5
Federated Neural Bandits	May 28, 2022	Multi-Armed Bandits	CodeCode Available	5
Addressing the Long-term Impact of ML Decisions via Policy Regret	Jun 2, 2021	Multi-Armed Bandits	CodeCode Available	5
Batched Multi-armed Bandits Problem	Apr 3, 2019	Multi-Armed Bandits	CodeCode Available	5

Show:10 25 50

← PrevPage 11 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified