SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 431–440 of 655 papers

Title	Date	Tasks	Status
SPRT-based Efficient Best Arm Identification in Stochastic Bandits	Jul 22, 2022	Multi-Armed BanditsThompson Sampling	—Unverified
Stable Thompson Sampling: Valid Inference via Variance Inflation	May 29, 2025	Decision MakingThompson Sampling	—Unverified
Stage-wise Conservative Linear Bandits	Sep 30, 2020	FormThompson Sampling	—Unverified
Statistical Efficiency of Thompson Sampling for Combinatorial Semi-Bandits	Jun 11, 2020	Thompson Sampling	—Unverified
Stochastically Constrained Best Arm Identification with Thompson Sampling	Jan 7, 2025	Thompson Sampling	—Unverified
Stochastic Neural Network with Kronecker Flow	Jun 10, 2019	Multi-Armed BanditsThompson Sampling	—Unverified
Streaming kernel regression with provably adaptive mean, variance, and regularization	Aug 2, 2017	regressionThompson Sampling	—Unverified
Surrogate modeling for Bayesian optimization beyond a single Gaussian process	May 27, 2022	Bayesian OptimizationDrug Discovery	—Unverified
Synthetically Controlled Bandits	Feb 14, 2022	Thompson Sampling	—Unverified
Taming Non-stationary Bandits: A Bayesian Approach	Jul 31, 2017	Thompson Sampling	—Unverified

Show:10 25 50

← PrevPage 44 of 66Next →

No leaderboard results yet.