SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 581–590 of 1262 papers

Title	Date	Tasks	Status
Slowly Changing Adversarial Bandit Algorithms are Efficient for Discounted MDPs	May 18, 2022	Multi-Armed Banditsreinforcement-learning	—Unverified
Semi-Parametric Contextual Bandits with Graph-Laplacian Regularization	May 17, 2022	Multi-Armed BanditsThompson Sampling	—Unverified
From Dirichlet to Rubin: Optimistic Exploration in RL without Bonuses	May 16, 2022	Multi-Armed Bandits	—Unverified
Nearly Optimal Algorithms for Linear Contextual Bandits with Adversarial Corruptions	May 13, 2022	Multi-Armed Bandits	—Unverified
A Survey of Risk-Aware Multi-Armed Bandits	May 12, 2022	Multi-Armed BanditsPortfolio Optimization	—Unverified
Federated Multi-Armed Bandits Under Byzantine Attacks	May 9, 2022	Data PoisoningDecision Making	—Unverified
Selectively Contextual Bandits	May 9, 2022	Multi-Armed Bandits	—Unverified
Multi-Player Multi-Armed Bandits with Finite Shareable Resources Arms: Learning Algorithms & Applications	Apr 28, 2022	Edge-computingMulti-Armed Bandits	—Unverified
Thompson Sampling for Bandit Learning in Matching Markets	Apr 26, 2022	Multi-Armed BanditsThompson Sampling	CodeCode Available
Evolutionary Multi-Armed Bandits with Genetic Thompson Sampling	Apr 26, 2022	Decision MakingEvolutionary Algorithms	CodeCode Available

Show:10 25 50

← PrevPage 59 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified