SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 671–680 of 1262 papers

Title	Date	Tasks	Status
Fundamental Limits of Online and Distributed Algorithms for Statistical Learning and Estimation	Nov 14, 2013	Multi-Armed BanditsStochastic Optimization	—Unverified
Garbage In, Reward Out: Bootstrapping Exploration in Multi-Armed Bandits	Nov 13, 2018	Multi-Armed Bandits	—Unverified
Gaussian Process bandits with adaptive discretization	Dec 5, 2017	Multi-Armed Bandits	—Unverified
Generalized Policy Elimination: an efficient algorithm for Nonparametric Contextual Bandits	Mar 5, 2020	Multi-Armed Bandits	—Unverified
Generalized Risk-Aversion in Stochastic Multi-Armed Bandits	May 5, 2014	Multi-Armed Bandits	—Unverified
Generalized Thompson Sampling for Contextual Bandits	Oct 27, 2013	Multi-Armed BanditsThompson Sampling	—Unverified
Generalized Translation and Scale Invariant Online Algorithm for Adversarial Multi-Armed Bandits	Sep 19, 2021	Multi-Armed BanditsTranslation	—Unverified
Generalizing distribution of partial rewards for multi-armed bandits with temporally-partitioned rewards	Nov 13, 2022	Multi-Armed Bandits	—Unverified
Genetic multi-armed bandits: a reinforcement learning approach for discrete optimization via simulation	Feb 15, 2023	Multi-Armed BanditsStochastic Optimization	—Unverified
GINO-Q: Learning an Asymptotically Optimal Index Policy for Restless Multi-armed Bandits	Aug 19, 2024	Multi-Armed BanditsQ-Learning	—Unverified

Show:10 25 50

← PrevPage 68 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified