SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 311–320 of 655 papers

Title	Date	Tasks	Status
An improved regret analysis for UCB-N and TS-N	May 6, 2023	LEMMAThompson Sampling	—Unverified
Influencing Bandits: Arm Selection for Preference Shaping	Feb 29, 2024	Recommendation SystemsThompson Sampling	—Unverified
Combinatorial Neural Bandits	May 31, 2023	Thompson Sampling	—Unverified
Information Directed Sampling and Bandits with Heteroscedastic Noise	Jan 29, 2018	Bayesian OptimizationThompson Sampling	—Unverified
Information Directed Sampling for Stochastic Bandits with Graph Feedback	Nov 8, 2017	Decision MakingThompson Sampling	—Unverified
Information-Theoretic Confidence Bounds for Reinforcement Learning	Nov 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
IntelligentPooling: Practical Thompson Sampling for mHealth	Jul 31, 2020	reinforcement-learningReinforcement Learning	—Unverified
Joint User Association and Pairing in Multi-UAV-Assisted NOMA Networks: A Decaying-Epsilon Thompson Sampling Framework	Jun 20, 2024	Thompson Sampling	—Unverified
KABB: Knowledge-Aware Bayesian Bandits for Dynamic Expert Coordination in Multi-Agent Systems	Feb 11, 2025	Thompson Sampling	—Unverified
KLUCB Approach to Copeland Bandits	Feb 7, 2019	Information RetrievalReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 32 of 66Next →

No leaderboard results yet.