SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–660 of 1262 papers

Title	Date	Tasks	Status
Nonparametric Contextual Bandits in Metric Spaces with Unknown Metric	Dec 1, 2019	Multi-Armed Bandits	—Unverified
Nonparametric Stochastic Contextual Bandits	Jan 5, 2018	General Classificationimage-classification	—Unverified
Non-Stationary Contextual Bandit Learning via Neural Predictive Ensemble Sampling	Oct 11, 2023	Multi-Armed Bandits	—Unverified
Adversarial Rewards in Universal Learning for Contextual Bandits	Feb 14, 2023	Multi-Armed Bandits	—Unverified
Non-Stationary Learning of Neural Networks with Automatic Soft Parameter Reset	Nov 6, 2024	Continual LearningMulti-Armed Bandits	—Unverified
Non-stationary Reinforcement Learning without Prior Knowledge: An Optimal Black-box Approach	Feb 10, 2021	Multi-Armed Banditsreinforcement-learning	—Unverified
Nonstochastic Multi-Armed Bandits with Graph-Structured Feedback	Sep 30, 2014	Multi-Armed Bandits	—Unverified
Non-Stochastic Multi-Player Multi-Armed Bandits: Optimal Rate With Collision Information, Sublinear Without	Apr 28, 2019	Multi-Armed Bandits	—Unverified
No-Regret is not enough! Bandits with General Constraints through Adaptive Regret Minimization	May 10, 2024	Multi-Armed Bandits	—Unverified
No-Regret Learning for Fair Multi-Agent Social Welfare Optimization	May 31, 2024	FairnessMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 66 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified