SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 361–370 of 1262 papers

Title	Date	Tasks	Status
Efficient Prompt Optimization Through the Lens of Best Arm Identification	Feb 15, 2024	Instruction FollowingMulti-Armed Bandits	—Unverified
An efficient algorithm for contextual bandits with knapsacks, and an extension to concave objectives	Jun 10, 2015	Multi-Armed BanditsOpen-Ended Question Answering	—Unverified
Differentially Private Multi-Armed Bandits in the Shuffle Model	Jun 5, 2021	Multi-Armed Bandits	—Unverified
Differentially Private Kernelized Contextual Bandits	Jan 13, 2025	Multi-Armed Bandits	—Unverified
Diffusion Models Meet Contextual Bandits with Large Action Spaces	Feb 15, 2024	Efficient ExplorationMulti-Armed Bandits	—Unverified
Diminishing Exploration: A Minimalist Approach to Piecewise Stationary Multi-Armed Bandits	Oct 8, 2024	Change DetectionMulti-Armed Bandits	—Unverified
Be Greedy in Multi-Armed Bandits	Jan 4, 2021	Multi-Armed Bandits	—Unverified
Discrete Choice Multi-Armed Bandits	Oct 1, 2023	Discrete Choice ModelsMulti-Armed Bandits	—Unverified
Disentangling Exploration from Exploitation	Apr 29, 2024	DisentanglementMulti-Armed Bandits	—Unverified
Differentially Private Episodic Reinforcement Learning with Heavy-tailed Rewards	Jun 1, 2023	Multi-Armed Banditsreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 37 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified