SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 371–380 of 655 papers

Title	Date	Tasks	Status
High-dimensional near-optimal experiment design for drug discovery via Bayesian sparse sampling	Apr 23, 2021	Bayesian InferenceDrug Discovery	—Unverified
Horde of Bandits using Gaussian Markov Random Fields	Mar 7, 2017	ClusteringMulti-Armed Bandits	—Unverified
Human collective intelligence as distributed Bayesian inference	Aug 5, 2016	Bayesian InferenceDecision Making	—Unverified
Hypermodels for Exploration	Jun 12, 2020	Thompson Sampling	—Unverified
IBAC: An Intelligent Dynamic Bandwidth Channel Access Avoiding Outside Warning Range Problem	Jan 15, 2022	Thompson Sampling	—Unverified
Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning	Oct 30, 2023	reinforcement-learningReinforcement Learning	—Unverified
Improved Regret Bounds for Thompson Sampling in Linear Quadratic Control Problems	Jul 1, 2018	Reinforcement LearningThompson Sampling	—Unverified
Improved Worst-Case Regret Bounds for Randomized Least-Squares Value Iteration	Oct 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Improving Reward-Conditioned Policies for Multi-Armed Bandits using Normalized Weight Functions	Jun 16, 2024	Multi-Armed BanditsPolicy Gradient Methods	—Unverified
Improving sample efficiency of high dimensional Bayesian optimization with MCMC	Jan 5, 2024	Bayesian OptimizationThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 38 of 66Next →

No leaderboard results yet.