SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 421–430 of 1262 papers

Title	Date	Tasks	Status
Efficient Contextual Bandits with Uninformed Feedback Graphs	Feb 12, 2024	Multi-Armed Banditsregression	—Unverified
Cost-Efficient Distributed Learning via Combinatorial Multi-Armed Bandits	Feb 16, 2022	Multi-Armed Bandits	—Unverified
Bypassing the Monster: A Faster and Simpler Optimal Algorithm for Contextual Bandits under Realizability	Mar 28, 2020	Multi-Armed Banditsregression	—Unverified
Efficient First-Order Contextual Bandits: Prediction, Allocation, and Triangular Discrimination	Jul 5, 2021	Decision MakingMulti-Armed Bandits	—Unverified
Bypassing the Simulator: Near-Optimal Adversarial Linear Contextual Bandits	Sep 2, 2023	Computational EfficiencyMulti-Armed Bandits	—Unverified
Efficient Generalized Low-Rank Tensor Contextual Bandits	Nov 3, 2023	Decision MakingMulti-Armed Bandits	—Unverified
Efficient Implementation of LinearUCB through Algorithmic Improvements and Vector Computing Acceleration for Embedded Learning Systems	Jan 22, 2025	Decision MakingEdge-computing	—Unverified
Byzantine-Resilient Decentralized Multi-Armed Bandits	Oct 11, 2023	Multi-Armed BanditsRecommendation Systems	—Unverified
Adapting to Misspecification in Contextual Bandits	Jul 12, 2021	Multi-Armed Banditsregression	—Unverified
Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit Feedback	Jan 21, 2021	Multi-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 43 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified