Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 676–700 of 1262 papers

Title	Date	Tasks	Status
Adapting Bandit Algorithms for Settings with Sequentially Available Arms	Sep 30, 2021	ManagementMulti-Armed Bandits	—Unverified
Regularized-OFU: an efficient algorithm for general contextual bandit with optimization oracles	Sep 29, 2021	Multi-Armed BanditsThompson Sampling	—Unverified
Causal Contextual Bandits with Targeted Interventions	Sep 29, 2021	Multi-Armed Bandits	—Unverified
Expected Improvement-based Contextual Bandits	Sep 29, 2021	Bayesian OptimizationMulti-Armed Bandits	—Unverified
Batched Bandits with Crowd Externalities	Sep 29, 2021	Multi-Armed Bandits	—Unverified
Risk averse non-stationary multi-armed bandits	Sep 28, 2021	Multi-Armed Bandits	—Unverified
Robust Generalization of Quadratic Neural Networks via Function Identification	Sep 22, 2021	Generalization BoundsLearning Theory	—Unverified
Generalized Translation and Scale Invariant Online Algorithm for Adversarial Multi-Armed Bandits	Sep 19, 2021	Multi-Armed BanditsTranslation	—Unverified
Field Study in Deploying Restless Multi-Armed Bandits: Assisting Non-Profits in Improving Maternal and Child Health	Sep 16, 2021	Multi-Armed Bandits	—Unverified
Estimation of Warfarin Dosage with Reinforcement Learning	Sep 15, 2021	Multi-Armed Banditsreinforcement-learning	CodeCode Available
Exploiting Heterogeneity in Robust Federated Best-Arm Identification	Sep 13, 2021	Multi-Armed Bandits	—Unverified
Improved Algorithms for Misspecified Linear Markov Decision Processes	Sep 12, 2021	Multi-Armed Bandits	—Unverified
Best-Arm Identification in Correlated Multi-Armed Bandits	Sep 10, 2021	Multi-Armed Bandits	—Unverified
Online Learning for Cooperative Multi-Player Multi-Armed Bandits	Sep 7, 2021	Multi-Armed Bandits	—Unverified
Max-Utility Based Arm Selection Strategy For Sequential Query Recommendations	Aug 31, 2021	Multi-Armed Bandits	—Unverified
No DBA? No regret! Multi-armed bandits for index tuning of analytical and HTAP workloads with provable guarantees	Aug 23, 2021	Decision MakingDecision Making Under Uncertainty	—Unverified
Batched Thompson Sampling for Multi-Armed Bandits	Aug 15, 2021	Multi-Armed BanditsThompson Sampling	—Unverified
Metadata-based Multi-Task Bandits with Bayesian Hierarchical Models	Aug 13, 2021	Multi-Armed BanditsThompson Sampling	—Unverified
Regret Analysis of Learning-Based MPC with Partially-Unknown Cost Function	Aug 4, 2021	Multi-Armed Bandits	—Unverified
Maximizing and Satisficing in Multi-armed Bandits with Graph Information	Aug 2, 2021	Decision MakingMulti-Armed Bandits	CodeCode Available
Indexability and Rollout Policy for Multi-State Partially Observable Restless Bandits	Jul 30, 2021	Multi-Armed BanditsRecommendation Systems	—Unverified
Combining Online Learning and Offline Learning for Contextual Bandits with Deficient Support	Jul 24, 2021	Multi-Armed Bandits	—Unverified
Finite-time Analysis of Globally Nonstationary Multi-Armed Bandits	Jul 23, 2021	Multi-Armed Bandits	CodeCode Available
From Predictions to Decisions: The Importance of Joint Predictive Distributions	Jul 20, 2021	Multi-Armed BanditsThompson Sampling	—Unverified
An Analysis of Reinforcement Learning for Malaria Control	Jul 19, 2021	Multi-Armed BanditsOpenAI Gym	—Unverified

Show:10 25 50

← PrevPage 28 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified