SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–160 of 655 papers

Title	Date	Tasks	Status
Thompson Sampling for Stochastic Bandits with Noisy Contexts: An Information-Theoretic Regret Analysis	Jan 21, 2024	Thompson Sampling	—Unverified
Model-Free Approximate Bayesian Learning for Large-Scale Conversion Funnel Optimization	Jan 12, 2024	Decision MakingMarketing	—Unverified
Decentralized Multi-Agent Active Search and Tracking when Targets Outnumber Agents	Jan 6, 2024	Decision MakingThompson Sampling	—Unverified
Improving sample efficiency of high dimensional Bayesian optimization with MCMC	Jan 5, 2024	Bayesian OptimizationThompson Sampling	—Unverified
Zero-Inflated Bandits	Dec 25, 2023	Multi-Armed BanditsThompson Sampling	—Unverified
Finite-Time Frequentist Regret Bounds of Multi-Agent Thompson Sampling on Sparse Hypergraphs	Dec 24, 2023	Computational EfficiencyThompson Sampling	CodeCode Available
Best Arm Identification in Batched Multi-armed Bandit Problems	Dec 21, 2023	MarketingThompson Sampling	—Unverified
Bayesian Analysis of Combinatorial Gaussian Process Bandits	Dec 20, 2023	Bayesian InferenceInformativeness	—Unverified
RoME: A Robust Mixed-Effects Bandit Algorithm for Optimizing Mobile Health Interventions	Dec 11, 2023	Multi-Armed BanditsOff-policy evaluation	CodeCode Available
Sample-based Dynamic Hierarchical Transformer with Layer and Head Flexibility via Contextual Bandit	Dec 5, 2023	Thompson Sampling	—Unverified

Show:10 25 50

← PrevPage 16 of 66Next →

No leaderboard results yet.