SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 491–500 of 1262 papers

Title	Date	Tasks	Status
Hypothesis Transfer in Bandits by Weighted Models	Nov 14, 2022	Multi-Armed BanditsTransfer Learning	—Unverified
Contextual Bandits with Packing and Covering Constraints: A Modular Lagrangian Approach via Regression	Nov 14, 2022	Multi-Armed Banditsregression	—Unverified
Generalizing distribution of partial rewards for multi-armed bandits with temporally-partitioned rewards	Nov 13, 2022	Multi-Armed Bandits	—Unverified
Thompson Sampling for High-Dimensional Sparse Linear Contextual Bandits	Nov 11, 2022	Multi-Armed BanditsThompson Sampling	CodeCode Available
Safe and Adaptive Decision-Making for Optimization of Safety-Critical Systems: The ARTEO Algorithm	Nov 10, 2022	Decision MakingDecision Making Under Uncertainty	CodeCode Available
Adaptive Data Depth via Multi-Armed Bandits	Nov 8, 2022	Multi-Armed Bandits	CodeCode Available
Contexts can be Cheap: Solving Stochastic Contextual Bandits with Linear Bandit Algorithms	Nov 8, 2022	Multi-Armed Bandits	—Unverified
Revisiting Simple Regret: Fast Rates for Returning a Good Arm	Oct 30, 2022	Multi-Armed Bandits	—Unverified
Robust Contextual Linear Bandits	Oct 26, 2022	Multi-Armed Bandits	—Unverified
PAC-Bayesian Offline Contextual Bandits With Guarantees	Oct 24, 2022	Generalization BoundsMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 50 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified