SOTAVerified|Agents Browse Leaderboard About

Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–660 of 1262 papers

Title	Date	Tasks	Status
Offline Contextual Bandits for Wireless Network Optimization	Nov 11, 2021	Computational EfficiencyMulti-Armed Bandits	—Unverified
Universal and data-adaptive algorithms for model selection in linear contextual bandits	Nov 8, 2021	DiversityModel Selection	—Unverified
An Instance-Dependent Analysis for the Cooperative Multi-Player Multi-Armed Bandit	Nov 8, 2021	Multi-Armed Bandits	—Unverified
Empirical analysis of representation learning and exploration in neural kernel bandits	Nov 5, 2021	Bayesian InferenceDecision Making	CodeCode Available
Privacy-Preserving Communication-Efficient Federated Multi-Armed Bandits	Nov 2, 2021	Decision MakingMulti-Armed Bandits	—Unverified
Bandits Don’t Follow Rules: Balancing Multi-Facet Machine Translation with Multi-Armed Bandits	Nov 1, 2021	Machine TranslationMulti-Armed Bandits	—Unverified
Decentralized Cooperative Reinforcement Learning with Hierarchical Information Structure	Nov 1, 2021	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified
(Almost) Free Incentivized Exploration from Decentralized Learning Agents	Oct 27, 2021	Multi-Armed Bandits	CodeCode Available
Federated Linear Contextual Bandits	Oct 27, 2021	Multi-Armed Bandits	—Unverified
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available

Show:10 25 50

← PrevPage 66 of 127Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified