SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–460 of 655 papers

Title	Date	Tasks	Status
Thompson Sampling Achieves O(T) Regret in Linear Quadratic Control	Jun 17, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified
Thompson Sampling with Approximate Inference	Aug 14, 2019	Decision MakingThompson Sampling	—Unverified
Thompson Sampling and Approximate Inference	Dec 1, 2019	Decision MakingThompson Sampling	—Unverified
Analysis of Thompson Sampling for Controlling Unknown Linear Diffusion Processes	Jun 20, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified
Thompson Sampling for 1-Dimensional Exponential Family Bandits	Jul 12, 2013	Thompson Sampling	—Unverified
Thompson Sampling for Adversarial Bit Prediction	Jun 21, 2019	PredictionThompson Sampling	—Unverified
Thompson Sampling for Bandits with Clustered Arms	Sep 6, 2021	ClusteringThompson Sampling	—Unverified
Thompson Sampling for Budgeted Multi-armed Bandits	May 1, 2015	Multi-Armed BanditsThompson Sampling	—Unverified
Thompson Sampling Algorithms for Cascading Bandits	Oct 2, 2018	Efficient ExplorationMulti-Armed Bandits	—Unverified
Thompson Sampling for Combinatorial Network Optimization in Unknown Environments	Jul 7, 2019	Combinatorial OptimizationThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 46 of 66Next →

No leaderboard results yet.