SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 461–470 of 655 papers

Title	Date	Tasks	Status
Thompson Sampling for (Combinatorial) Pure Exploration	Jun 18, 2022	Thompson Sampling	—Unverified
Thompson Sampling for Combinatorial Semi-Bandits	Mar 13, 2018	Thompson Sampling	—Unverified
Thompson Sampling for Combinatorial Semi-bandits with Sleeping Arms and Long-Term Fairness Constraints	May 14, 2020	FairnessMovie Recommendation	—Unverified
Thompson Sampling for Complex Bandit Problems	Nov 3, 2013	Thompson Sampling	—Unverified
Thompson Sampling for Contextual Bandit Problems with Auxiliary Safety Constraints	Nov 2, 2019	Bayesian OptimizationDecision Making	—Unverified
Thompson Sampling for Dynamic Pricing	Feb 8, 2018	Active LearningThompson Sampling	—Unverified
Thompson Sampling for Gaussian Entropic Risk Bandits	May 14, 2021	Decision MakingThompson Sampling	—Unverified
Thompson sampling for improved exploration in GFlowNets	Jun 30, 2023	Active LearningDecision Making	—Unverified
Thompson Sampling for Infinite-Horizon Discounted Decision Processes	May 14, 2024	Thompson Sampling	—Unverified
Thompson Sampling for Learning Parameterized Markov Decision Processes	Jun 29, 2014	Formreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 47 of 66Next →

No leaderboard results yet.