SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 1262 papers

Title	Date	Tasks	Status	Score
Active Feature Selection for the Mutual Information Criterion	Dec 13, 2020	feature selectionMulti-Armed Bandits	CodeCode Available	5
Flooding with Absorption: An Efficient Protocol for Heterogeneous Bandits over Complex Networks	Mar 9, 2023	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Combinatorial Multi-armed Bandits for Resource Allocation	May 10, 2021	Multi-Armed Bandits	CodeCode Available	5
Combining Diverse Information for Coordinated Action: Stochastic Bandit Algorithms for Heterogeneous Agents	Aug 6, 2024	Multi-Armed BanditsSensitivity	CodeCode Available	5
Conditionally Risk-Averse Contextual Bandits	Oct 24, 2022	ManagementMulti-Armed Bandits	CodeCode Available	5
Contextual Bandits with Smooth Regret: Efficient Learning in Continuous Action Spaces	Jul 12, 2022	continuous-controlContinuous Control	CodeCode Available	5
Cascading Bandits for Large-Scale Recommendation Problems	Mar 17, 2016	Multi-Armed BanditsRecommendation Systems	CodeCode Available	5
Adaptive Data Depth via Multi-Armed Bandits	Nov 8, 2022	Multi-Armed Bandits	CodeCode Available	5
Causal Contextual Bandits with Adaptive Context	May 28, 2024	Multi-Armed Bandits	CodeCode Available	5
Budgeted Multi-Armed Bandits with Asymmetric Confidence Intervals	Jun 12, 2023	Multi-Armed Bandits	CodeCode Available	5

Show:10 25 50

← PrevPage 8 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified