Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 1262 papers

Title	Date	Tasks	Status	Score
Efficient Kernel UCB for Contextual Bandits	Feb 11, 2022	Computational EfficiencyMulti-Armed Bandits	CodeCode Available	5
Empirical Likelihood for Contextual Bandits	Jun 7, 2019	Multi-Armed Bandits	CodeCode Available	5
Causally Abstracted Multi-armed Bandits	Apr 26, 2024	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Evolutionary Multi-Armed Bandits with Genetic Thompson Sampling	Apr 26, 2022	Decision MakingEvolutionary Algorithms	CodeCode Available	5
From Complexity to Simplicity: Adaptive ES-Active Subspaces for Blackbox Optimization	Mar 7, 2019	compressed sensingMulti-Armed Bandits	CodeCode Available	5
Falcon: Fair Active Learning using Multi-armed Bandits	Jan 23, 2024	Active LearningAttribute	CodeCode Available	5
Federated Multi-armed Bandits with Personalization	Feb 25, 2021	Federated LearningMulti-Armed Bandits	CodeCode Available	5
Federated Neural Bandits	May 28, 2022	Multi-Armed Bandits	CodeCode Available	5
Addressing the Long-term Impact of ML Decisions via Policy Regret	Jun 2, 2021	Multi-Armed Bandits	CodeCode Available	5
Antithetic Sampling for Top-k Shapley Identification	Apr 2, 2025	Multi-Armed Bandits	CodeCode Available	5
Combinatorial Bandits under Strategic Manipulations	Feb 25, 2021	Multi-Armed BanditsRecommendation Systems	CodeCode Available	5
Cascading Bandits for Large-Scale Recommendation Problems	Mar 17, 2016	Multi-Armed BanditsRecommendation Systems	CodeCode Available	5
AC-Band: A Combinatorial Bandit-Based Approach to Algorithm Configuration	Dec 1, 2022	Multi-Armed Bandits	CodeCode Available	5
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available	5
Causal Contextual Bandits with Adaptive Context	May 28, 2024	Multi-Armed Bandits	CodeCode Available	5
Hierarchical Multi-Armed Bandits for the Concurrent Intelligent Tutoring of Concepts and Problems of Varying Difficulty Levels	Aug 10, 2024	Knowledge TracingMulti-Armed Bandits	CodeCode Available	5
Adversarial Attacks on Combinatorial Multi-Armed Bandits	Oct 8, 2023	Multi-Armed Bandits	CodeCode Available	5
Combinatorial Multi-armed Bandits for Resource Allocation	May 10, 2021	Multi-Armed Bandits	CodeCode Available	5
Confident Off-Policy Evaluation and Selection through Self-Normalized Importance Weighting	Jun 18, 2020	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	5
Incorporating Multi-armed Bandit with Local Search for MaxSAT	Nov 29, 2022	Multi-Armed Bandits	CodeCode Available	5
Infinite Action Contextual Bandits with Reusable Data Exhaust	Feb 16, 2023	Model SelectionMulti-Armed Bandits	CodeCode Available	5
Online SuBmodular + SuPermodular (BP) Maximization with Bandit Feedback	Jul 7, 2022	Computational EfficiencyMovie Recommendation	CodeCode Available	5
A Survey of Online Experiment Design with the Stochastic Multi-Armed Bandit	Oct 2, 2015	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Invariant Policy Learning: A Causal Perspective	Jun 1, 2021	Multi-Armed BanditsRecommendation Systems	CodeCode Available	5
Best Arm Identification with Fixed Budget: A Large Deviation Perspective	Dec 19, 2023	Multi-Armed Bandits	CodeCode Available	5

Show:10 25 50

← PrevPage 5 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified