SOTAVerified|Agents Browse Leaderboard About

Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 121–130 of 655 papers

Title	Date	Tasks	Status
Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Making	May 23, 2024	Decision MakingSequential Decision Making	—Unverified
Smart Routing with Precise Link Estimation: DSEE-Based Anypath Routing for Reliable Wireless Networking	May 16, 2024	Thompson Sampling	—Unverified
Analyzing and Enhancing Queue Sampling for Energy-Efficient Remote Control of Bandits	May 15, 2024	Autonomous VehiclesThompson Sampling	—Unverified
Thompson Sampling for Infinite-Horizon Discounted Decision Processes	May 14, 2024	Thompson Sampling	—Unverified
Constructing Adversarial Examples for Vertical Federated Learning: Optimal Client Corruption through Multi-Armed Bandit	May 7, 2024	Federated LearningThompson Sampling	CodeCode Available
Efficient and Adaptive Posterior Sampling Algorithms for Bandits	May 2, 2024	Thompson Sampling	—Unverified
Bayesian Optimization with LLM-Based Acquisition Functions for Natural Language Preference Elicitation	May 2, 2024	Bayesian OptimizationConversational Recommendation	—Unverified
Bayesian-Guided Generation of Synthetic Microbiomes with Minimized Pathogenicity	Apr 29, 2024	Bayesian OptimizationThompson Sampling	—Unverified
Randomized Exploration in Cooperative Multi-Agent Reinforcement Learning	Apr 16, 2024	Federated LearningMulti-agent Reinforcement Learning	—Unverified
Feel-Good Thompson Sampling for Contextual Dueling Bandits	Apr 9, 2024	Decision MakingMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 13 of 66Next →

No leaderboard results yet.