Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–475 of 1262 papers

Title	Date	Tasks	Status	Hype
Networked Restless Bandits with Positive Externalities	Dec 9, 2022	Multi-Armed Bandits	CodeCode Available	0
Stochastic Rising Bandits	Dec 7, 2022	Model SelectionMulti-Armed Bandits	CodeCode Available	0
AC-Band: A Combinatorial Bandit-Based Approach to Algorithm Configuration	Dec 1, 2022	Multi-Armed Bandits	CodeCode Available	0
On Regret-optimal Cooperative Nonstochastic Multi-armed Bandits	Nov 30, 2022	Multi-Armed Bandits	—Unverified	0
Incorporating Multi-armed Bandit with Local Search for MaxSAT	Nov 29, 2022	Multi-Armed Bandits	CodeCode Available	0
Constrained Pure Exploration Multi-Armed Bandits with a Fixed Budget	Nov 27, 2022	AttributeMulti-Armed Bandits	—Unverified	0
Contextual Decision-Making with Knapsacks Beyond the Worst Case	Nov 25, 2022	Decision MakingManagement	—Unverified	0
Contextual Bandits in a Survey Experiment on Charitable Giving: Within-Experiment Outcomes versus Policy Learning	Nov 22, 2022	Multi-Armed Bandits	—Unverified	0
Transfer Learning for Contextual Multi-armed Bandits	Nov 22, 2022	Multi-Armed BanditsTransfer Learning	—Unverified	0
Causal Bandits: Online Decision-Making in Endogenous Settings	Nov 16, 2022	Decision MakingMulti-Armed Bandits	—Unverified	0
Bandit Algorithms for Prophet Inequality and Pandora's Box	Nov 16, 2022	Multi-Armed BanditsStochastic Optimization	—Unverified	0
Latent Bottlenecked Attentive Neural Processes	Nov 15, 2022	Meta-LearningMulti-Armed Bandits	CodeCode Available	0
Multi-Player Bandits Robust to Adversarial Collisions	Nov 15, 2022	Multi-Armed Bandits	—Unverified	0
On Penalization in Stochastic Multi-armed Bandits	Nov 15, 2022	FairnessMulti-Armed Bandits	—Unverified	0
Contextual Bandits with Packing and Covering Constraints: A Modular Lagrangian Approach via Regression	Nov 14, 2022	Multi-Armed Banditsregression	—Unverified	0
Hypothesis Transfer in Bandits by Weighted Models	Nov 14, 2022	Multi-Armed BanditsTransfer Learning	—Unverified	0
Generalizing distribution of partial rewards for multi-armed bandits with temporally-partitioned rewards	Nov 13, 2022	Multi-Armed Bandits	—Unverified	0
Thompson Sampling for High-Dimensional Sparse Linear Contextual Bandits	Nov 11, 2022	Multi-Armed BanditsThompson Sampling	CodeCode Available	0
Safe and Adaptive Decision-Making for Optimization of Safety-Critical Systems: The ARTEO Algorithm	Nov 10, 2022	Decision MakingDecision Making Under Uncertainty	CodeCode Available	0
Contexts can be Cheap: Solving Stochastic Contextual Bandits with Linear Bandit Algorithms	Nov 8, 2022	Multi-Armed Bandits	—Unverified	0
Adaptive Data Depth via Multi-Armed Bandits	Nov 8, 2022	Multi-Armed Bandits	CodeCode Available	0
Indexability is Not Enough for Whittle: Improved, Near-Optimal Algorithms for Restless Bandits	Oct 31, 2022	Multi-Armed Bandits	CodeCode Available	1
Revisiting Simple Regret: Fast Rates for Returning a Good Arm	Oct 30, 2022	Multi-Armed Bandits	—Unverified	0
Robust Contextual Linear Bandits	Oct 26, 2022	Multi-Armed Bandits	—Unverified	0
Conditionally Risk-Averse Contextual Bandits	Oct 24, 2022	ManagementMulti-Armed Bandits	CodeCode Available	0

Show:10 25 50

← PrevPage 19 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified