Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 655 papers

Title	Date	Tasks	Status
Thompson Sampling Achieves O(T) Regret in Linear Quadratic Control	Jun 17, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified
Thompson Sampling with Approximate Inference	Aug 14, 2019	Decision MakingThompson Sampling	—Unverified
Thompson Sampling and Approximate Inference	Dec 1, 2019	Decision MakingThompson Sampling	—Unverified
Analysis of Thompson Sampling for Controlling Unknown Linear Diffusion Processes	Jun 20, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified
Thompson Sampling for 1-Dimensional Exponential Family Bandits	Jul 12, 2013	Thompson Sampling	—Unverified
Thompson Sampling for Adversarial Bit Prediction	Jun 21, 2019	PredictionThompson Sampling	—Unverified
Thompson Sampling for Bandits with Clustered Arms	Sep 6, 2021	ClusteringThompson Sampling	—Unverified
Thompson Sampling for Budgeted Multi-armed Bandits	May 1, 2015	Multi-Armed BanditsThompson Sampling	—Unverified
Thompson Sampling Algorithms for Cascading Bandits	Oct 2, 2018	Efficient ExplorationMulti-Armed Bandits	—Unverified
Thompson Sampling for Combinatorial Network Optimization in Unknown Environments	Jul 7, 2019	Combinatorial OptimizationThompson Sampling	—Unverified
Thompson Sampling for (Combinatorial) Pure Exploration	Jun 18, 2022	Thompson Sampling	—Unverified
Thompson Sampling for Combinatorial Semi-Bandits	Mar 13, 2018	Thompson Sampling	—Unverified
Thompson Sampling for Combinatorial Semi-bandits with Sleeping Arms and Long-Term Fairness Constraints	May 14, 2020	FairnessMovie Recommendation	—Unverified
Thompson Sampling for Complex Bandit Problems	Nov 3, 2013	Thompson Sampling	—Unverified
Thompson Sampling for Contextual Bandit Problems with Auxiliary Safety Constraints	Nov 2, 2019	Bayesian OptimizationDecision Making	—Unverified
Thompson Sampling for Dynamic Pricing	Feb 8, 2018	Active LearningThompson Sampling	—Unverified
Thompson Sampling for Gaussian Entropic Risk Bandits	May 14, 2021	Decision MakingThompson Sampling	—Unverified
Thompson sampling for improved exploration in GFlowNets	Jun 30, 2023	Active LearningDecision Making	—Unverified
Thompson Sampling for Infinite-Horizon Discounted Decision Processes	May 14, 2024	Thompson Sampling	—Unverified
Thompson Sampling for Learning Parameterized Markov Decision Processes	Jun 29, 2014	Formreinforcement-learning	—Unverified
Thompson Sampling for Linear Bandit Problems with Normal-Gamma Priors	Mar 6, 2023	Thompson Sampling	—Unverified
Thompson Sampling for Linear-Quadratic Control Problems	Mar 27, 2017	Reinforcement LearningThompson Sampling	—Unverified
Thompson sampling for linear quadratic mean-field teams	Nov 9, 2020	Thompson Sampling	—Unverified
Thompson Sampling for Noncompliant Bandits	Dec 3, 2018	Thompson Sampling	—Unverified
Thompson Sampling for Online Learning with Linear Experts	Nov 3, 2013	Thompson Sampling	—Unverified
Thompson Sampling for Parameterized Markov Decision Processes with Uninformative Actions	May 13, 2023	Bayesian InferenceThompson Sampling	—Unverified
Thompson Sampling for Pursuit-Evasion Problems	Nov 11, 2018	Thompson Sampling	—Unverified
Thompson Sampling for Real-Valued Combinatorial Pure Exploration of Multi-Armed Bandit	Aug 20, 2023	Thompson Sampling	—Unverified
Thompson Sampling For Stochastic Bandits with Graph Feedback	Jan 16, 2017	Thompson Sampling	—Unverified
Thompson Sampling for Stochastic Bandits with Noisy Contexts: An Information-Theoretic Regret Analysis	Jan 21, 2024	Thompson Sampling	—Unverified
Thompson Sampling for the MNL-Bandit	Jun 3, 2017	Thompson Sampling	—Unverified
Thompson Sampling for Unimodal Bandits	Jun 15, 2021	Thompson Sampling	—Unverified
Thompson Sampling for Unsupervised Sequential Selection	Sep 16, 2020	Multi-Armed BanditsThompson Sampling	—Unverified
Thompson sampling for zero-inflated count outcomes with an application to the Drink Less mobile health study	Nov 24, 2023	Decision MakingMulti-Armed Bandits	—Unverified
Thompson Sampling Guided Stochastic Searching on the Line for Deceptive Environments with Applications to Root-Finding Problems	Aug 5, 2017	Stochastic OptimizationThompson Sampling	—Unverified
Thompson Sampling in Dynamic Systems for Contextual Bandit Problems	Oct 17, 2013	Thompson Sampling	—Unverified
Thompson Sampling in Non-Episodic Restless Bandits	Oct 12, 2019	Open-Ended Question AnsweringThompson Sampling	—Unverified
Thompson Sampling in Online RLHF with General Function Approximation	May 29, 2025	Thompson Sampling	—Unverified
Thompson Sampling in Partially Observable Contextual Bandits	Feb 15, 2024	Decision MakingDecision Making Under Uncertainty	—Unverified
Thompson Sampling is Asymptotically Optimal in General Environments	Feb 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Thompson Sampling Itself is Differentially Private	Jul 20, 2024	Thompson Sampling	—Unverified
Thompson Sampling-like Algorithms for Stochastic Rising Bandits	May 17, 2025	Model SelectionThompson Sampling	—Unverified
Thompson Sampling on Asymmetric α-Stable Bandits	Mar 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Thompson Sampling on Symmetric α-Stable Bandits	Jul 8, 2019	Bayesian InferenceDecision Making	—Unverified
Thompson Sampling Regret Bounds for Contextual Bandits with sub-Gaussian rewards	Apr 26, 2023	Multi-Armed BanditsThompson Sampling	—Unverified
Thompson Sampling under Bernoulli Rewards with Local Differential Privacy	Jul 3, 2023	Thompson Sampling	—Unverified
Thompson Sampling with a Mixture Prior	Jun 10, 2021	Decision MakingMulti-Task Learning	—Unverified
Thompson Sampling with Diffusion Generative Prior	Jan 12, 2023	Decision MakingDenoising	—Unverified
Thompson sampling with the online bootstrap	Oct 15, 2014	Thompson Sampling	—Unverified
Thompson Sampling with Unrestricted Delays	Feb 24, 2022	Thompson Sampling	—Unverified

Show:10 25 50

← PrevPage 10 of 14Next →

No leaderboard results yet.