SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1161–1170 of 1262 papers

Title	Date	Tasks	Status
Towards Bayesian Data Selection	Jun 18, 2024	Active LearningAdditive models	—Unverified
Bayesian decision-making under misspecified priors with applications to meta-learning	Jul 3, 2021	Decision MakingMeta-Learning	—Unverified
BEACON: Balancing Convenience and Nutrition in Meals With Long-Term Group Recommendations and Reasoning on Multimodal Recipes	Jun 19, 2024	Multi-Armed BanditsNutrition	—Unverified
Beam Learning -- Using Machine Learning for Finding Beam Directions	Jun 11, 2019	BIG-bench Machine LearningMulti-Armed Bandits	—Unverified
Be Greedy in Multi-Armed Bandits	Jan 4, 2021	Multi-Armed Bandits	—Unverified
Efficient Prompt Optimization Through the Lens of Best Arm Identification	Feb 15, 2024	Instruction FollowingMulti-Armed Bandits	—Unverified
Quantile Multi-Armed Bandits: Optimal Best-Arm Identification and a Differentially Private Scheme	Jun 11, 2020	Multi-Armed Bandits	—Unverified
Best-Arm Identification in Correlated Multi-Armed Bandits	Sep 10, 2021	Multi-Armed Bandits	—Unverified
Best Arm Identification in Linked Bandits	Nov 19, 2018	Multi-Armed Bandits	—Unverified
Best arm identification in multi-armed bandits with delayed feedback	Mar 29, 2018	Hyperparameter OptimizationMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 117 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified