SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 141–150 of 655 papers

Title	Date	Tasks	Status
The Sliding Regret in Stochastic Bandits: Discriminating Index and Randomized Policies	Nov 30, 2023	Thompson Sampling	—Unverified
Thompson sampling for zero-inflated count outcomes with an application to the Drink Less mobile health study	Nov 24, 2023	Decision MakingMulti-Armed Bandits	—Unverified
Probabilistic Inference in Reinforcement Learning Done Right	Nov 22, 2023	reinforcement-learningReinforcement Learning	—Unverified
A Distributed Neural Linear Thompson Sampling Framework to Achieve URLLC in Industrial IoT	Nov 21, 2023	SchedulingThompson Sampling	—Unverified
Adaptive Interventions with User-Defined Goals for Health Behavior Change	Nov 16, 2023	Thompson Sampling	CodeCode Available
Exploration via linearly perturbed loss minimisation	Nov 13, 2023	Thompson Sampling	—Unverified
Posterior Sampling-Based Bayesian Optimization with Tighter Bayesian Regret Bounds	Nov 7, 2023	Bayesian OptimizationThompson Sampling	—Unverified
Batch Bayesian Optimization for Replicable Experimental Design	Nov 2, 2023	AutoMLBayesian Optimization	—Unverified
Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning	Oct 30, 2023	reinforcement-learningReinforcement Learning	—Unverified
Dual-Directed Algorithm Design for Efficient Pure Exploration	Oct 30, 2023	Thompson Sampling	—Unverified

Show:10 25 50

← PrevPage 15 of 66Next →

No leaderboard results yet.