Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 1262 papers

Title	Date	Tasks	Status	Score
Bayesian Design Principles for Frequentist Sequential Learning	Oct 1, 2023	Multi-Armed Banditsreinforcement-learning	CodeCode Available	5
Bayesian Optimisation over Multiple Continuous and Categorical Inputs	Jun 20, 2019	Bayesian OptimisationDiversity	CodeCode Available	5
Kernel Conditional Moment Constraints for Confounding Robust Inference	Feb 26, 2023	Multi-Armed BanditsSensitivity	CodeCode Available	5
Scalable Exploration via Ensemble++	Jul 18, 2024	Computational EfficiencyDecision Making	CodeCode Available	5
Causally Abstracted Multi-armed Bandits	Apr 26, 2024	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Learning Contextual Bandits in a Non-stationary Environment	May 23, 2018	Multi-Armed BanditsRecommendation Systems	CodeCode Available	5
Learning Structural Weight Uncertainty for Sequential Decision-Making	Dec 30, 2017	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Locally Differentially Private (Contextual) Bandits Learning	Jun 1, 2020	Multi-Armed BanditsPrivacy Preserving Deep Learning	CodeCode Available	5
Locally Private Nonparametric Contextual Multi-armed Bandits	Mar 11, 2025	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Budgeted Multi-Armed Bandits with Asymmetric Confidence Intervals	Jun 12, 2023	Multi-Armed Bandits	CodeCode Available	5
Low-Rank Bandits via Tight Two-to-Infinity Singular Subspace Recovery	Feb 24, 2024	Multi-Armed Bandits	CodeCode Available	5
Adaptive Linear Estimating Equations	Jul 14, 2023	Multi-Armed Bandits	CodeCode Available	5
Master-slave Deep Architecture for Top-K Multi-armed Bandits with Non-linear Bandit Feedback and Diversity Constraints	Aug 24, 2023	DiversityMulti-Armed Bandits	CodeCode Available	5
Best Arm Identification with Fixed Budget: A Large Deviation Perspective	Dec 19, 2023	Multi-Armed Bandits	CodeCode Available	5
Meta-in-context learning in large language models	May 22, 2023	In-Context LearningMulti-Armed Bandits	CodeCode Available	5
Empirical analysis of representation learning and exploration in neural kernel bandits	Nov 5, 2021	Bayesian InferenceDecision Making	CodeCode Available	5
Multi-agent Multi-armed Bandits with Minimum Reward Guarantee Fairness	Feb 21, 2025	FairnessMulti-Armed Bandits	CodeCode Available	5
Distribution oblivious, risk-aware algorithms for multi-armed bandits with unbounded rewards	Jun 3, 2019	Multi-Armed Bandits	CodeCode Available	5
Multi-Armed Bandits in Brain-Computer Interfaces	May 19, 2022	Multi-Armed Bandits	CodeCode Available	5
Bandit-Based Monte Carlo Optimization for Nearest Neighbors	May 21, 2018	ClusteringMulti-Armed Bandits	CodeCode Available	5
Multi-Armed Bandits with Network Interference	May 28, 2024	Multi-Armed Bandits	CodeCode Available	5
An Experimental Design for Anytime-Valid Causal Inference on Multi-Armed Bandits	Nov 9, 2023	Causal InferenceExperimental Design	CodeCode Available	5
Myopic Bayesian Design of Experiments via Posterior Sampling and Probabilistic Programming	May 25, 2018	Bayesian InferenceMulti-Armed Bandits	CodeCode Available	5
Model selection for contextual bandits	Jun 3, 2019	modelModel Selection	CodeCode Available	5
Censored Semi-Bandits: A Framework for Resource Allocation with Censored Feedback	Sep 4, 2019	Multi-Armed Bandits	CodeCode Available	5

Show:10 25 50

← PrevPage 8 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified