SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 541–550 of 655 papers

Title	Date	Tasks	Status
Myopic Bayesian Design of Experiments via Posterior Sampling and Probabilistic Programming	May 25, 2018	Bayesian InferenceMulti-Armed Bandits	CodeCode Available
New Insights into Bootstrapping for Bandits	May 24, 2018	Thompson Sampling	—Unverified
Analysis of Thompson Sampling for Graphical Bandits Without the Graphs	May 23, 2018	Thompson Sampling	—Unverified
PG-TS: Improved Thompson Sampling for Logistic Contextual Bandits	May 18, 2018	Multi-Armed BanditsThompson Sampling	—Unverified
Profitable Bandits	May 8, 2018	ManagementThompson Sampling	—Unverified
Thompson Sampling for Combinatorial Semi-Bandits	Mar 13, 2018	Thompson Sampling	—Unverified
Active Reinforcement Learning with Monte-Carlo Tree Search	Mar 13, 2018	reinforcement-learningReinforcement Learning	—Unverified
Satisficing in Time-Sensitive Bandit Learning	Mar 7, 2018	Thompson Sampling	—Unverified
Deep Bayesian Bandits Showdown: An Empirical Comparison of Bayesian Deep Networks for Thompson Sampling	Feb 26, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Efficient Exploration through Bayesian Deep Q-Networks	Feb 13, 2018	Atari GamesEfficient Exploration	CodeCode Available

Show:10 25 50

← PrevPage 55 of 66Next →

No leaderboard results yet.