SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 291–300 of 655 papers

Title	Date	Tasks	Status
High-dimensional near-optimal experiment design for drug discovery via Bayesian sparse sampling	Apr 23, 2021	Bayesian InferenceDrug Discovery	—Unverified
Horde of Bandits using Gaussian Markov Random Fields	Mar 7, 2017	ClusteringMulti-Armed Bandits	—Unverified
Human collective intelligence as distributed Bayesian inference	Aug 5, 2016	Bayesian InferenceDecision Making	—Unverified
Hypermodels for Exploration	Jun 12, 2020	Thompson Sampling	—Unverified
IBAC: An Intelligent Dynamic Bandwidth Channel Access Avoiding Outside Warning Range Problem	Jan 15, 2022	Thompson Sampling	—Unverified
Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning	Oct 30, 2023	reinforcement-learningReinforcement Learning	—Unverified
Improved Regret Bounds for Thompson Sampling in Linear Quadratic Control Problems	Jul 1, 2018	Reinforcement LearningThompson Sampling	—Unverified
Improved Worst-Case Regret Bounds for Randomized Least-Squares Value Iteration	Oct 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Chained Information-Theoretic bounds and Tight Regret Rate for Linear Bandit Problems	Mar 5, 2024	Thompson Sampling	—Unverified
Fast online inference for nonlinear contextual bandit based on Generative Adversarial Network	Feb 17, 2022	Bayesian InferenceGenerative Adversarial Network	—Unverified

Show:10 25 50

← PrevPage 30 of 66Next →

No leaderboard results yet.