Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 655 papers

Title	Date	Tasks	Status	Score
Efficient Optimal Selection for Composited Advertising Creatives with Tree Structure	Mar 2, 2021	Efficient ExplorationThompson Sampling	CodeCode Available	5
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models	Jul 3, 2015	Atari Gamesreinforcement-learning	CodeCode Available	5
Neural Bandits for Data Mining: Searching for Dangerous Polypharmacy	Dec 10, 2022	Thompson Sampling	CodeCode Available	5
Constructing Adversarial Examples for Vertical Federated Learning: Optimal Client Corruption through Multi-Armed Bandit	May 7, 2024	Federated LearningThompson Sampling	CodeCode Available	5
Cost-Efficient Online Decision Making: A Combinatorial Multi-Armed Bandit Approach	Aug 21, 2023	Decision MakingMulti-Armed Bandits	CodeCode Available	5
Bayesian Optimization for Categorical and Category-Specific Continuous Inputs	Nov 28, 2019	Bayesian OptimizationBIG-bench Machine Learning	CodeCode Available	5
Sample-Efficient Model-Free Reinforcement Learning with Off-Policy Critics	Mar 11, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Bayesian Learning of Optimal Policies in Markov Decision Processes with Countably Infinite State-Space	Jun 5, 2023	Thompson Sampling	—Unverified	0
Bayesian-Guided Generation of Synthetic Microbiomes with Minimized Pathogenicity	Apr 29, 2024	Bayesian OptimizationThompson Sampling	—Unverified	0
An Empirical Evaluation of Thompson Sampling	Dec 1, 2011	Multi-Armed BanditsThompson Sampling	—Unverified	0
Bayesian decision-making under misspecified priors with applications to meta-learning	Jul 3, 2021	Decision MakingMeta-Learning	—Unverified	0
Bayesian Collaborative Bandits with Thompson Sampling for Improved Outreach in Maternal Health Program	Oct 28, 2024	Matrix CompletionThompson Sampling	—Unverified	0
Adaptive Grey-Box Fuzz-Testing with Thompson Sampling	Aug 24, 2018	Thompson Sampling	—Unverified	0
Bayesian Best-Arm Identification for Selecting Influenza Mitigation Strategies	Nov 16, 2017	Decision MakingThompson Sampling	—Unverified	0
An Efficient Algorithm For Generalized Linear Bandit: Online Stochastic Gradient Descent and Thompson Sampling	Jun 7, 2020	Thompson Sampling	—Unverified	0
Bayesian Bandit Algorithms with Approximate Inference in Stochastic Linear Bandits	Jun 20, 2024	Bayesian InferenceThompson Sampling	—Unverified	0
An Arm-Wise Randomization Approach to Combinatorial Linear Semi-Bandits	Sep 5, 2019	Decision MakingRecommendation Systems	—Unverified	0
Adaptive Gating for Single-Photon 3D Imaging	Nov 30, 2021	PositionThompson Sampling	—Unverified	0
A Combinatorial Semi-Bandit Approach to Charging Station Selection for Electric Vehicles	Jan 17, 2023	Combinatorial OptimizationThompson Sampling	—Unverified	0
Batched Thompson Sampling for Multi-Armed Bandits	Aug 15, 2021	Multi-Armed BanditsThompson Sampling	—Unverified	0
Batched Thompson Sampling	Oct 1, 2021	Multi-Armed BanditsThompson Sampling	—Unverified	0
An Analysis of Ensemble Sampling	Mar 2, 2022	Thompson Sampling	—Unverified	0
Batch Bayesian Optimization for Replicable Experimental Design	Nov 2, 2023	AutoMLBayesian Optimization	—Unverified	0
Analyzing and Enhancing Queue Sampling for Energy-Efficient Remote Control of Bandits	May 15, 2024	Autonomous VehiclesThompson Sampling	—Unverified	0
Bandit Theory and Thompson Sampling-Guided Directed Evolution for Sequence Optimization	Jun 5, 2022	BIG-bench Machine LearningEvolutionary Algorithms	—Unverified	0

Show:10 25 50

← PrevPage 6 of 27Next →

No leaderboard results yet.