SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–360 of 655 papers

Title	Date	Tasks	Status
Optimality of Thompson Sampling with Noninformative Priors for Pareto Bandits	Feb 3, 2023	Thompson Sampling	—Unverified
Optimal Learning for Dynamic Coding in Deadline-Constrained Multi-Channel Networks	Nov 27, 2018	Thompson Sampling	—Unverified
Optimal No-regret Learning in Repeated First-price Auctions	Mar 22, 2020	Multi-Armed BanditsThompson Sampling	—Unverified
Optimal Recommendation to Users that React: Online Learning for a Class of POMDPs	Mar 30, 2016	Recommendation SystemsReinforcement Learning	—Unverified
Optimistic posterior sampling for reinforcement learning: worst-case regret bounds	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Optimistic Thompson Sampling for No-Regret Learning in Unknown Games	Feb 7, 2024	Decision MakingThompson Sampling	—Unverified
Optimization of a SSP's Header Bidding Strategy using Thompson Sampling	Jul 9, 2018	Thompson Sampling	—Unverified
Optimizing Adaptive Experiments: A Unified Approach to Regret Minimization and Best-Arm Identification	Feb 16, 2024	Thompson Sampling	—Unverified
Ordinal Bayesian Optimisation	Dec 5, 2019	Bayesian OptimisationThompson Sampling	—Unverified
Parallel and Distributed Thompson Sampling for Large-scale Accelerated Exploration of Chemical Space	Jun 6, 2017	Bayesian OptimizationThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 36 of 66Next →

No leaderboard results yet.