SOTAVerified|Agents Browse Leaderboard About Blog

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 626–650 of 1262 papers

Title	Date	Tasks	Status	Hype
Optimal Algorithms for Stochastic Contextual Preference Bandits	Dec 1, 2021	Decision MakingInformation Retrieval	—Unverified	0
Identification of the Generalized Condorcet Winner in Multi-dueling Bandits	Dec 1, 2021	Multi-Armed Bandits	CodeCode Available	0
Asymptotically Best Causal Effect Identification with Multi-Armed Bandits	Dec 1, 2021	Multi-Armed Bandits	—Unverified	0
Subgaussian and Differentiable Importance Sampling for Off-Policy Evaluation and Learning	Dec 1, 2021	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	0
Bandits with Knapsacks beyond the Worst Case	Dec 1, 2021	Multi-Armed Bandits	—Unverified	0
Multi-Armed Bandits with Bounded Arm-Memory: Near-Optimal Guarantees for Best-Arm Identification and Regret Minimization	Dec 1, 2021	Multi-Armed BanditsOpen-Ended Question Answering	—Unverified	0
Online Fair Revenue Maximizing Cake Division with Non-Contiguous Pieces in Adversarial Bandits	Nov 29, 2021	FairnessMulti-Armed Bandits	—Unverified	0
Offline Neural Contextual Bandits: Pessimism, Optimization and Generalization	Nov 27, 2021	Multi-Armed Bandits	CodeCode Available	1
Decentralized Upper Confidence Bound Algorithms for Homogeneous Multi-Agent Multi-Armed Bandits	Nov 22, 2021	Multi-Armed Bandits	—Unverified	0
Offline Contextual Bandits for Wireless Network Optimization	Nov 11, 2021	Computational EfficiencyMulti-Armed Bandits	—Unverified	0
An Instance-Dependent Analysis for the Cooperative Multi-Player Multi-Armed Bandit	Nov 8, 2021	Multi-Armed Bandits	—Unverified	0
Universal and data-adaptive algorithms for model selection in linear contextual bandits	Nov 8, 2021	DiversityModel Selection	—Unverified	0
Empirical analysis of representation learning and exploration in neural kernel bandits	Nov 5, 2021	Bayesian InferenceDecision Making	CodeCode Available	0
Privacy-Preserving Communication-Efficient Federated Multi-Armed Bandits	Nov 2, 2021	Decision MakingMulti-Armed Bandits	—Unverified	0
Bandits Don’t Follow Rules: Balancing Multi-Facet Machine Translation with Multi-Armed Bandits	Nov 1, 2021	Machine TranslationMulti-Armed Bandits	—Unverified	0
Decentralized Cooperative Reinforcement Learning with Hierarchical Information Structure	Nov 1, 2021	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified	0
(Almost) Free Incentivized Exploration from Decentralized Learning Agents	Oct 27, 2021	Multi-Armed Bandits	CodeCode Available	0
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available	0
Federated Linear Contextual Bandits	Oct 27, 2021	Multi-Armed Bandits	—Unverified	0
The Pareto Frontier of model selection for general Contextual Bandits	Oct 25, 2021	Model SelectionMulti-Armed Bandits	—Unverified	0
Linear Contextual Bandits with Adversarial Corruptions	Oct 25, 2021	Multi-Armed Bandits	—Unverified	0
Analysis of Thompson Sampling for Partially Observable Contextual Multi-Armed Bandits	Oct 23, 2021	Decision MakingMulti-Armed Bandits	—Unverified	0
Towards the D-Optimal Online Experiment Design for Recommender Selection	Oct 23, 2021	Multi-Armed Bandits	CodeCode Available	0
Dynamic pricing and assortment under a contextual MNL demand	Oct 19, 2021	Multi-Armed Bandits	—Unverified	0
Stateful Offline Contextual Policy Evaluation and Learning	Oct 19, 2021	ManagementMulti-Armed Bandits	—Unverified	0

Show:10 25 50

← PrevPage 26 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified