SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 471–480 of 655 papers

Title	Date	Tasks	Status
Thompson Sampling for Linear Bandit Problems with Normal-Gamma Priors	Mar 6, 2023	Thompson Sampling	—Unverified
Thompson Sampling for Linear-Quadratic Control Problems	Mar 27, 2017	Reinforcement LearningThompson Sampling	—Unverified
Thompson sampling for linear quadratic mean-field teams	Nov 9, 2020	Thompson Sampling	—Unverified
Thompson Sampling for Noncompliant Bandits	Dec 3, 2018	Thompson Sampling	—Unverified
Thompson Sampling for Online Learning with Linear Experts	Nov 3, 2013	Thompson Sampling	—Unverified
Thompson Sampling for Parameterized Markov Decision Processes with Uninformative Actions	May 13, 2023	Bayesian InferenceThompson Sampling	—Unverified
Thompson Sampling for Pursuit-Evasion Problems	Nov 11, 2018	Thompson Sampling	—Unverified
Thompson Sampling for Real-Valued Combinatorial Pure Exploration of Multi-Armed Bandit	Aug 20, 2023	Thompson Sampling	—Unverified
Thompson Sampling For Stochastic Bandits with Graph Feedback	Jan 16, 2017	Thompson Sampling	—Unverified
Thompson Sampling for Stochastic Bandits with Noisy Contexts: An Information-Theoretic Regret Analysis	Jan 21, 2024	Thompson Sampling	—Unverified

Show:10 25 50

← PrevPage 48 of 66Next →

No leaderboard results yet.