SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 461–470 of 1262 papers

Title	Date	Tasks	Status
Bandit Algorithms for Prophet Inequality and Pandora's Box	Nov 16, 2022	Multi-Armed BanditsStochastic Optimization	—Unverified
Latent Bottlenecked Attentive Neural Processes	Nov 15, 2022	Meta-LearningMulti-Armed Bandits	CodeCode Available
Multi-Player Bandits Robust to Adversarial Collisions	Nov 15, 2022	Multi-Armed Bandits	—Unverified
On Penalization in Stochastic Multi-armed Bandits	Nov 15, 2022	FairnessMulti-Armed Bandits	—Unverified
Contextual Bandits with Packing and Covering Constraints: A Modular Lagrangian Approach via Regression	Nov 14, 2022	Multi-Armed Banditsregression	—Unverified
Hypothesis Transfer in Bandits by Weighted Models	Nov 14, 2022	Multi-Armed BanditsTransfer Learning	—Unverified
Generalizing distribution of partial rewards for multi-armed bandits with temporally-partitioned rewards	Nov 13, 2022	Multi-Armed Bandits	—Unverified
Thompson Sampling for High-Dimensional Sparse Linear Contextual Bandits	Nov 11, 2022	Multi-Armed BanditsThompson Sampling	CodeCode Available
Safe and Adaptive Decision-Making for Optimization of Safety-Critical Systems: The ARTEO Algorithm	Nov 10, 2022	Decision MakingDecision Making Under Uncertainty	CodeCode Available
Contexts can be Cheap: Solving Stochastic Contextual Bandits with Linear Bandit Algorithms	Nov 8, 2022	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 47 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified