SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 491–500 of 655 papers

Title	Date	Tasks	Status
Thompson Sampling Itself is Differentially Private	Jul 20, 2024	Thompson Sampling	—Unverified
Thompson Sampling-like Algorithms for Stochastic Rising Bandits	May 17, 2025	Model SelectionThompson Sampling	—Unverified
Thompson Sampling on Asymmetric α-Stable Bandits	Mar 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Thompson Sampling on Symmetric α-Stable Bandits	Jul 8, 2019	Bayesian InferenceDecision Making	—Unverified
Thompson Sampling Regret Bounds for Contextual Bandits with sub-Gaussian rewards	Apr 26, 2023	Multi-Armed BanditsThompson Sampling	—Unverified
Thompson Sampling under Bernoulli Rewards with Local Differential Privacy	Jul 3, 2023	Thompson Sampling	—Unverified
Thompson Sampling with a Mixture Prior	Jun 10, 2021	Decision MakingMulti-Task Learning	—Unverified
Thompson Sampling with Diffusion Generative Prior	Jan 12, 2023	Decision MakingDenoising	—Unverified
Thompson sampling with the online bootstrap	Oct 15, 2014	Thompson Sampling	—Unverified
Thompson Sampling with Unrestricted Delays	Feb 24, 2022	Thompson Sampling	—Unverified

Show:10 25 50

← PrevPage 50 of 66Next →

No leaderboard results yet.