SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 641–650 of 1262 papers

Title	Date	Tasks	Status
Contextual Bandit Applications in Customer Support Bot	Dec 6, 2021	Multi-Armed Bandits	—Unverified
On Submodular Contextual Bandits	Dec 3, 2021	Multi-Armed Bandits	—Unverified
Bandits with Knapsacks beyond the Worst Case	Dec 1, 2021	Multi-Armed Bandits	—Unverified
Identification of the Generalized Condorcet Winner in Multi-dueling Bandits	Dec 1, 2021	Multi-Armed Bandits	CodeCode Available
Optimal Algorithms for Stochastic Contextual Preference Bandits	Dec 1, 2021	Decision MakingInformation Retrieval	—Unverified
Subgaussian and Differentiable Importance Sampling for Off-Policy Evaluation and Learning	Dec 1, 2021	Multi-Armed BanditsOff-policy evaluation	CodeCode Available
Multi-Armed Bandits with Bounded Arm-Memory: Near-Optimal Guarantees for Best-Arm Identification and Regret Minimization	Dec 1, 2021	Multi-Armed BanditsOpen-Ended Question Answering	—Unverified
Asymptotically Best Causal Effect Identification with Multi-Armed Bandits	Dec 1, 2021	Multi-Armed Bandits	—Unverified
Online Fair Revenue Maximizing Cake Division with Non-Contiguous Pieces in Adversarial Bandits	Nov 29, 2021	FairnessMulti-Armed Bandits	—Unverified
Decentralized Upper Confidence Bound Algorithms for Homogeneous Multi-Agent Multi-Armed Bandits	Nov 22, 2021	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 65 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified