SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 281–290 of 1262 papers

Title	Date	Tasks	Status	Hype
Foundations of Reinforcement Learning and Interactive Decision Making	Dec 27, 2023	Decision MakingMulti-Armed Bandits	—Unverified	0
Best-of-Both-Worlds Linear Contextual Bandits	Dec 27, 2023	Multi-Armed Bandits	—Unverified	0
Harnessing the Power of Federated Learning in Federated Contextual Bandits	Dec 26, 2023	Decision MakingFederated Learning	CodeCode Available	0
Diversity-Based Recruitment in Crowdsensing By Combinatorial Multi-Armed Bandits	Dec 25, 2023	DiversityMulti-Armed Bandits	—Unverified	0
Zero-Inflated Bandits	Dec 25, 2023	Multi-Armed BanditsThompson Sampling	—Unverified	0
Best-of-Both-Worlds Algorithms for Linear Contextual Bandits	Dec 24, 2023	Multi-Armed Bandits	—Unverified	0
Neural Contextual Bandits for Personalized Recommendation	Dec 21, 2023	Multi-Armed BanditsRecommendation Systems	—Unverified	0
In-Context Reinforcement Learning for Variable Action Spaces	Dec 20, 2023	In-Context Reinforcement LearningMulti-Armed Bandits	CodeCode Available	1
Bayesian Analysis of Combinatorial Gaussian Process Bandits	Dec 20, 2023	Bayesian InferenceInformativeness	—Unverified	0
Distribution-Dependent Rates for Multi-Distribution Learning	Dec 20, 2023	Multi-Armed Bandits	—Unverified	0

Show:10 25 50

← PrevPage 29 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified