SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 421–430 of 655 papers

Title	Date	Tasks	Status
Metadata-based Multi-Task Bandits with Bayesian Hierarchical Models	Aug 13, 2021	Multi-Armed BanditsThompson Sampling	—Unverified
Meta Dynamic Pricing: Transfer Learning Across Experiments	Feb 28, 2019	Thompson SamplingTransfer Learning	—Unverified
Meta Learning in Bandits within Shared Affine Subspaces	Mar 31, 2024	Meta-LearningThompson Sampling	—Unverified
Metalearning Linear Bandits by Prior Update	Jul 12, 2021	Decision MakingSequential Decision Making	—Unverified
Meta Learning of Interface Conditions for Multi-Domain Physics-Informed Neural Networks	Oct 23, 2022	Meta-LearningThompson Sampling	—Unverified
Meta-Reinforcement Learning With Informed Policy Regularization	Jan 1, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
Meta-Thompson Sampling	Feb 11, 2021	Efficient ExplorationMeta-Learning	—Unverified
Minimal Exploration in Structured Stochastic Bandits	Nov 1, 2017	Thompson Sampling	—Unverified
TS-RSR: A provably efficient approach for batch Bayesian Optimization	Mar 7, 2024	Bayesian OptimizationThompson Sampling	—Unverified
Mixed-Variable Bayesian Optimization	Jul 2, 2019	Bayesian OptimizationThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 43 of 66Next →

No leaderboard results yet.