SOTAVerified|Agents Browse Leaderboard About Blog

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 655 papers

Title	Date	Tasks	Status	Hype
Representative Action Selection for Large Action-Space Meta-Bandits	May 23, 2025	Thompson Sampling	CodeCode Available	0
Deconfounded Warm-Start Thompson Sampling with Applications to Precision Medicine	May 22, 2025	Thompson Sampling	—Unverified	0
Scalable and Interpretable Contextual Bandits: A Literature Review and Retail Offer Prototype	May 22, 2025	Feature EngineeringLarge Language Model	—Unverified	0
Generator-Mediated Bandits: Thompson Sampling for GenAI-Powered Adaptive Interventions	May 22, 2025	Large Language ModelThompson Sampling	—Unverified	0
In-Domain African Languages Translation Using LLMs and Multi-armed Bandits	May 21, 2025	Domain AdaptationMachine Translation	—Unverified	0
Steering Generative Models with Experimental Data for Protein Fitness Optimization	May 21, 2025	Bayesian OptimizationThompson Sampling	CodeCode Available	1
Dynamic Decision-Making under Model Misspecification	May 20, 2025	Decision Makingmodel	—Unverified	0
Addressing Missing Data Issue for Diffusion-based Recommendation	May 18, 2025	DenoisingThompson Sampling	CodeCode Available	0
Thompson Sampling-like Algorithms for Stochastic Rising Bandits	May 17, 2025	Model SelectionThompson Sampling	—Unverified	0
Leveraging Offline Data from Similar Systems for Online Linear Quadratic Control	May 14, 2025	Thompson Sampling	—Unverified	0

Show:10 25 50

← PrevPage 2 of 66Next →

No leaderboard results yet.