Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1262 papers

Title	Date	Tasks	Status
Multi-Armed Bandits with Local Differential Privacy	Jul 6, 2020	Multi-Armed Bandits	—Unverified
Multi-Armed Bandits With Machine Learning-Generated Surrogate Rewards	Jun 20, 2025	Decision Making Under UncertaintyMulti-Armed Bandits	—Unverified
Multi-Armed Bandits with Metric Movement Costs	Oct 24, 2017	Multi-Armed Bandits	—Unverified
Multi-Armed Bandits with Self-Information Rewards	Sep 6, 2022	Multi-Armed Bandits	—Unverified
Multi-Fidelity Multi-Armed Bandits Revisited	Jun 13, 2023	Multi-Armed Bandits	—Unverified
Multilinguality in LLM-Designed Reward Functions for Restless Bandits: Effects on Task Performance and Fairness	Jan 20, 2025	FairnessMulti-Armed Bandits	—Unverified
Multinomial Logit Contextual Bandits: Provable Optimality and Practicality	Mar 25, 2021	Multi-Armed Bandits	—Unverified
Multi-Objective Generalized Linear Bandits	May 30, 2019	Multi-Armed Bandits	—Unverified
Multi-Player Approaches for Dueling Bandits	May 25, 2024	Multi-Armed Bandits	—Unverified
Multi-Player Bandits: A Trekking Approach	Sep 17, 2018	Multi-Armed Bandits	—Unverified
Multi-Player Bandits Revisited	Nov 7, 2017	Multi-Armed Bandits	—Unverified
Multi-Player Bandits Robust to Adversarial Collisions	Nov 15, 2022	Multi-Armed Bandits	—Unverified
Multiplayer Information Asymmetric Contextual Bandits	Mar 11, 2025	Multi-Armed Bandits	—Unverified
Multi-player Multi-armed Bandits with Collision-Dependent Reward Distributions	Jun 25, 2021	Multi-Armed Bandits	—Unverified
Multi-Player Multi-Armed Bandits with Finite Shareable Resources Arms: Learning Algorithms & Applications	Apr 28, 2022	Edge-computingMulti-Armed Bandits	—Unverified
Decentralized Heterogeneous Multi-Player Multi-Armed Bandits with Non-Zero Rewards on Collisions	Oct 21, 2019	Multi-Armed Bandits	—Unverified
Multiple-Play Stochastic Bandits with Shareable Finite-Capacity Arms	Jun 17, 2022	Multi-Armed Bandits	—Unverified
Multiplier Bootstrap-based Exploration	Feb 3, 2023	Multi-Armed Bandits	—Unverified
MultiScale Contextual Bandits for Long Term Objectives	Mar 22, 2025	Multi-Armed BanditsRecommendation Systems	—Unverified
Multi-Statistic Approximate Bayesian Computation with Multi-Armed Bandits	May 22, 2018	Feature EngineeringMulti-Armed Bandits	—Unverified
Multi-Task Learning for Contextual Bandits	May 24, 2017	Multi-Armed BanditsMulti-Task Learning	—Unverified
Multi-User MABs with User Dependent Rewards for Uncoordinated Spectrum Access	Oct 21, 2019	Multi-Armed Bandits	—Unverified
Multi-User Multi-Armed Bandits for Uncoordinated Spectrum Access	Jul 2, 2018	Multi-Armed Bandits	—Unverified
Navigating the Rashomon Effect: How Personalization Can Help Adjust Interpretable Machine Learning Models to Individual Users	May 11, 2025	Additive modelsInterpretable Machine Learning	—Unverified
Nearest Neighbor Search Under Uncertainty	Mar 8, 2021	Multi-Armed BanditsRepresentation Learning	—Unverified
Nearly Minimax-Optimal Regret for Linearly Parameterized Bandits	Mar 30, 2019	Multi-Armed Bandits	—Unverified
Nearly Optimal Algorithms for Linear Contextual Bandits with Adversarial Corruptions	May 13, 2022	Multi-Armed Bandits	—Unverified
Nearly-Optimal Bandit Learning in Stackelberg Games with Side Information	Jan 31, 2025	Multi-Armed Bandits	—Unverified
Towards a Sharp Analysis of Offline Policy Learning for f-Divergence-Regularized Contextual Bandits	Feb 9, 2025	Multi-Armed Bandits	—Unverified
Nearly Optimal Sampling Algorithms for Combinatorial Pure Exploration	Jun 4, 2017	Multi-Armed Bandits	—Unverified
Nearly-tight Approximation Guarantees for the Improving Multi-Armed Bandits Problem	Apr 1, 2024	Multi-Armed Bandits	—Unverified
Nearly Tight Bounds for Cross-Learning Contextual Bandits with Graphical Feedback	Feb 7, 2025	Multi-Armed Bandits	—Unverified
Nearly Tight Bounds for Exploration in Streaming Multi-armed Bandits with Known Optimality Gap	Feb 3, 2025	Multi-Armed Bandits	—Unverified
Near Optimal Best Arm Identification for Clustered Bandits	May 15, 2025	ClusteringComputational Efficiency	—Unverified
Near-Optimal Private Learning in Linear Contextual Bandits	Feb 18, 2025	Multi-Armed Bandits	—Unverified
Networked Restless Multi-Armed Bandits for Mobile Interventions	Jan 28, 2022	Multi-Armed Bandits	—Unverified
Networked Stochastic Multi-Armed Bandits with Combinatorial Strategies	Mar 20, 2015	Multi-Armed Bandits	—Unverified
Neural Bandit with Arm Group Graph	Jun 8, 2022	Multi-Armed Bandits	—Unverified
Neural Collaborative Filtering Bandits via Meta Learning	Jan 31, 2022	Collaborative FilteringDecision Making	—Unverified
Neural Contextual Bandits Based Dynamic Sensor Selection for Low-Power Body-Area Networks	May 24, 2022	Anomaly DetectionMulti-Armed Bandits	—Unverified
Neural Contextual Bandits for Personalized Recommendation	Dec 21, 2023	Multi-Armed BanditsRecommendation Systems	—Unverified
Neural Contextual Bandits Under Delayed Feedback Constraints	Apr 16, 2025	Multi-Armed BanditsRecommendation Systems	—Unverified
Reward-Biased Maximum Likelihood Estimation for Neural Contextual Bandits	Mar 8, 2022	Multi-Armed Bandits	—Unverified
Neural Contextual Bandits with Deep Representation and Shallow Exploration	Dec 3, 2020	Multi-Armed BanditsRepresentation Learning	—Unverified
Neural Network Retraining for Model Serving	Apr 29, 2020	modelMulti-Armed Bandits	—Unverified
Neural Risk-sensitive Satisficing in Contextual Bandits	Jan 15, 2025	Multi-Armed BanditsRecommendation Systems	—Unverified
NeuralUCB: Contextual Bandits with Neural Network-Based Exploration	Sep 25, 2019	Efficient ExplorationMulti-Armed Bandits	—Unverified
No DBA? No regret! Multi-armed bandits for index tuning of analytical and HTAP workloads with provable guarantees	Aug 23, 2021	Decision MakingDecision Making Under Uncertainty	—Unverified
Nonlinear Sequential Accepts and Rejects for Identification of Top Arms in Stochastic Bandits	Jul 9, 2017	Multi-Armed Bandits	—Unverified
Nonparametric Contextual Bandits in an Unknown Metric Space	Aug 3, 2019	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 13 of 26Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified