Multi-Armed Bandits

Multi-armed bandits refer to a task where a fixed amount of resources must be allocated between competing resources that maximizes expected gain. Typically these problems involve an exploration/exploitation trade-off.

( Image credit: Microsoft Research )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 1262 papers

Title	Date	Tasks	Status	Hype
Learning to Optimize Energy Efficiency in Energy Harvesting Wireless Sensor Networks	Dec 30, 2020	Multi-Armed Bandits	—Unverified	0
Lifelong Learning in Multi-Armed Bandits	Dec 28, 2020	Lifelong learningMulti-Armed Bandits	—Unverified	0
A Regret bound for Non-stationary Multi-Armed Bandits with Fairness Constraints	Dec 24, 2020	Decision MakingFairness	—Unverified	0
Expanding on Repeated Consumer Search Using Multi-Armed Bandits and Secretaries	Dec 22, 2020	Multi-Armed Bandits	—Unverified	0
Relational Boosted Bandits	Dec 16, 2020	AttributeDescriptive	CodeCode Available	0
A One-Size-Fits-All Solution to Conservative Bandit Problems	Dec 14, 2020	AllMulti-Armed Bandits	—Unverified	0
Active Feature Selection for the Mutual Information Criterion	Dec 13, 2020	feature selectionMulti-Armed Bandits	CodeCode Available	0
Adversarial Linear Contextual Bandits with Graph-Structured Side Observations	Dec 10, 2020	Multi-Armed Bandits	—Unverified	0
Streaming Algorithms for Stochastic Multi-armed Bandits	Dec 9, 2020	Multi-Armed BanditsOpen-Ended Question Answering	—Unverified	0
Efficient Automatic CASH via Rising Bandits	Dec 8, 2020	AutoMLBayesian Optimization	—Unverified	0
Accurate and Fast Federated Learning via Combinatorial Multi-Armed Bandits	Dec 6, 2020	BIG-bench Machine LearningFederated Learning	—Unverified	0
Distributed Thompson Sampling	Dec 3, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
Neural Contextual Bandits with Deep Representation and Shallow Exploration	Dec 3, 2020	Multi-Armed BanditsRepresentation Learning	—Unverified	0
Finding All -Good Arms in Stochastic Bandits	Dec 1, 2020	AllMulti-Armed Bandits	—Unverified	0
Batched Coarse Ranking in Multi-Armed Bandits	Dec 1, 2020	Multi-Armed Bandits	—Unverified	0
BanditPAM: Almost Linear Time k-Medoids Clustering via Multi-Armed Bandits	Dec 1, 2020	ClusteringMulti-Armed Bandits	CodeCode Available	1
Unreasonable Effectiveness of Greedy Algorithms in Multi-Armed Bandit with Many Arms	Dec 1, 2020	Multi-Armed Bandits	CodeCode Available	0
A Tractable Online Learning Algorithm for the Multinomial Logit Contextual Bandit	Nov 28, 2020	Decision MakingMulti-Armed Bandits	—Unverified	0
Resonance: Replacing Software Constants with Context-Aware Models in Real-time Communication	Nov 23, 2020	FrictionMulti-Armed Bandits	—Unverified	0
Fully Gap-Dependent Bounds for Multinomial Logit Bandit	Nov 19, 2020	Multi-Armed Bandits	—Unverified	0
Reward Biased Maximum Likelihood Estimation for Reinforcement Learning	Nov 16, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified	0
A New Bandit Setting Balancing Information from State Evolution and Corrupted Context	Nov 16, 2020	Decision MakingEfficient Exploration	CodeCode Available	0
Improving Offline Contextual Bandits with Distributional Robustness	Nov 13, 2020	counterfactualMulti-Armed Bandits	—Unverified	0
Metric-Free Individual Fairness with Cooperative Contextual Bandits	Nov 13, 2020	Decision MakingFairness	—Unverified	0
Active Reinforcement Learning: Observing Rewards at a Cost	Nov 13, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 32 of 51Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NeuralLinear FullPosterior-MR	Cumulative regret	1.92	—	Unverified
2	Linear FullPosterior-MR	Cumulative regret	1.82	—	Unverified