Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 626–650 of 1262 papers

Title	Date	Tasks	Status
Bandit Learning with Delayed Impact of Actions	Feb 24, 2020	FairnessMulti-Armed Bandits	—Unverified
Fair Contextual Multi-Armed Bandits: Theory and Experiments	Dec 13, 2019	Decision MakingFairness	—Unverified
Fair Exploration via Axiomatic Bargaining	Jun 4, 2021	FairnessMulti-Armed Bandits	—Unverified
Fairness and Privacy Guarantees in Federated Contextual Bandits	Feb 5, 2024	FairnessFederated Learning	—Unverified
Fairness and Welfare Quantification for Regret in Multi-Armed Bandits	May 27, 2022	FairnessMulti-Armed Bandits	—Unverified
Fairness for Workers Who Pull the Arms: An Index Based Policy for Allocation of Restless Bandit Tasks	Mar 1, 2023	FairnessMulti-Armed Bandits	—Unverified
Fairness in Learning: Classic and Contextual Bandits	May 23, 2016	FairnessMulti-Armed Bandits	—Unverified
Fairness of Exposure in Stochastic Bandits	Mar 3, 2021	FairnessMulti-Armed Bandits	—Unverified
Falsification of Multiple Requirements for Cyber-Physical Systems Using Online Generative Adversarial Networks and Multi-Armed Bandits	May 23, 2022	Multi-Armed Bandits	—Unverified
Fast and Sample Efficient Multi-Task Representation Learning in Stochastic Contextual Bandits	Oct 2, 2024	Multi-Armed BanditsMulti-Task Learning	—Unverified
Faster Maximum Inner Product Search in High Dimensions	Dec 14, 2022	Multi-Armed BanditsRecommendation Systems	—Unverified
Faster Q-Learning Algorithms for Restless Bandits	Sep 6, 2024	Multi-Armed BanditsQ-Learning	—Unverified
Fast UCB-type algorithms for stochastic bandits with heavy and super heavy symmetric noise	Feb 10, 2024	Multi-Armed Bandits	—Unverified
Federated Combinatorial Multi-Agent Multi-Armed Bandits	May 9, 2024	Combinatorial OptimizationData Summarization	—Unverified
Federated Linear Bandits with Finite Adversarial Actions	Nov 2, 2023	Multi-Armed Bandits	—Unverified
Federated Linear Contextual Bandits	Oct 27, 2021	Multi-Armed Bandits	—Unverified
Federated Linear Contextual Bandits with Heterogeneous Clients	Feb 29, 2024	AllFederated Learning	—Unverified
Federated Linear Contextual Bandits with User-level Differential Privacy	Jun 8, 2023	Decision MakingMulti-Armed Bandits	—Unverified
Federated Multi-Armed Bandits Under Byzantine Attacks	May 9, 2022	Data PoisoningDecision Making	—Unverified
Federated Online Sparse Decision Making	Feb 27, 2022	Decision MakingMulti-Armed Bandits	—Unverified
Federated Learning for Heterogeneous Bandits with Unobserved Contexts	Mar 29, 2023	Federated LearningMulti-Armed Bandits	—Unverified
FedMABA: Towards Fair Federated Learning through Multi-Armed Bandits Allocation	Oct 26, 2024	FairnessFederated Learning	—Unverified
Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning	Oct 2, 2021	Multi-Armed Banditsregression	—Unverified
Feel-Good Thompson Sampling for Contextual Dueling Bandits	Apr 9, 2024	Decision MakingMulti-Armed Bandits	—Unverified
Field Study in Deploying Restless Multi-Armed Bandits: Assisting Non-Profits in Improving Maternal and Child Health	Sep 16, 2021	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 26 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified