Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–425 of 655 papers

Title	Date	Tasks	Status	Hype
Causal Bandits without prior knowledge using separating sets	Sep 16, 2020	Causal DiscoveryDecision Making	—Unverified	0
Thompson Sampling for Unsupervised Sequential Selection	Sep 16, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
A Change-Detection Based Thompson Sampling Framework for Non-Stationary Bandits	Sep 6, 2020	Change DetectionThompson Sampling	—Unverified	0
Efficient Online Learning for Cognitive Radar-Cellular Coexistence via Contextual Thompson Sampling	Aug 24, 2020	Deep Reinforcement LearningThompson Sampling	—Unverified	0
Contextual Bandits for Advertising Budget Allocation	Aug 22, 2020	MarketingMulti-Armed Bandits	—Unverified	0
Near Optimal Adversarial Attacks on Stochastic Bandits and Defenses with Smoothed Responses	Aug 21, 2020	Adversarial AttackThompson Sampling	—Unverified	0
Reinforcement Learning with Trajectory Feedback	Aug 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Lenient Regret for Multi-Armed Bandits	Aug 10, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
IntelligentPooling: Practical Thompson Sampling for mHealth	Jul 31, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Greedy Bandits with Sampled Context	Jul 27, 2020	Decision MakingMulti-Armed Bandits	—Unverified	0
Influence Diagram Bandits: Variational Thompson Sampling for Structured Bandit Problems	Jul 9, 2020	Thompson Sampling	—Unverified	0
Meta-Learning Stationary Stochastic Process Prediction with Convolutional Neural Processes	Jul 2, 2020	Meta-LearningThompson Sampling	CodeCode Available	1
Variable Selection via Thompson Sampling	Jul 1, 2020	BIG-bench Machine LearningInterpretable Machine Learning	—Unverified	0
Policy Gradient Optimization of Thompson Sampling Policies	Jun 30, 2020	Policy Gradient MethodsThompson Sampling	—Unverified	0
Asynchronous Multi Agent Active Search	Jun 25, 2020	Bayesian OptimizationCompressive Sensing	—Unverified	0
Learning by Repetition: Stochastic Multi-armed Bandits under Priming Effect	Jun 18, 2020	Decision MakingMulti-Armed Bandits	—Unverified	0
Constrained Thompson Sampling for Real-Time Electricity Pricing with Grid Reliability Constraints	Jun 17, 2020	Thompson Sampling	—Unverified	0
Analysis and Design of Thompson Sampling for Stochastic Partial Monitoring	Jun 17, 2020	Decision MakingThompson Sampling	—Unverified	0
Latent Bandits Revisited	Jun 15, 2020	Recommendation SystemsThompson Sampling	—Unverified	0
Hypermodels for Exploration	Jun 12, 2020	Thompson Sampling	—Unverified	0
TS-UCB: Improving on Thompson Sampling With Little to No Additional Computation	Jun 11, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
On Frequentist Regret of Linear Thompson Sampling	Jun 11, 2020	Thompson Sampling	—Unverified	0
Statistical Efficiency of Thompson Sampling for Combinatorial Semi-Bandits	Jun 11, 2020	Thompson Sampling	—Unverified	0
Scalable Thompson Sampling using Sparse Gaussian Process Models	Jun 9, 2020	Thompson Sampling	—Unverified	0
Random Hypervolume Scalarizations for Provable Multi-Objective Black Box Optimization	Jun 8, 2020	Bayesian OptimizationThompson Sampling	—Unverified	0

Show:10 25 50

← PrevPage 17 of 27Next →

No leaderboard results yet.