Thompson Sampling

Thompson sampling, named after William R. Thompson, is a heuristic for choosing actions that addresses the exploration-exploitation dilemma in the multi-armed bandit problem. It consists of choosing the action that maximizes the expected reward with respect to a randomly drawn belief.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 426–450 of 655 papers

Title	Date	Tasks	Status	Hype
An Efficient Algorithm For Generalized Linear Bandit: Online Stochastic Gradient Descent and Thompson Sampling	Jun 7, 2020	Thompson Sampling	—Unverified	0
Concurrent Decentralized Channel Allocation and Access Point Selection using Multi-Armed Bandits in multi BSS WLANs	Jun 5, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
Seamlessly Unifying Attributes and Items: Conversational Recommendation for Cold-Start Users	May 23, 2020	Collaborative FilteringConversational Recommendation	CodeCode Available	1
Thompson Sampling for Combinatorial Semi-bandits with Sleeping Arms and Long-Term Fairness Constraints	May 14, 2020	FairnessMovie Recommendation	—Unverified	0
Learning to Rank in the Position Based Model with Bandit Feedback	Apr 27, 2020	Learning-To-RankMulti-Armed Bandits	—Unverified	0
Online Learning with Cumulative Oversampling: Application to Budgeted Influence Maximization	Apr 24, 2020	Thompson Sampling	—Unverified	0
Adaptive Operator Selection Based on Dynamic Thompson Sampling for MOEA/D	Apr 22, 2020	Thompson Sampling	—Unverified	0
Thompson Sampling for Linearly Constrained Bandits	Apr 20, 2020	Multi-Armed BanditsThompson Sampling	CodeCode Available	0
Optimal No-regret Learning in Repeated First-price Auctions	Mar 22, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
A Reliability-aware Multi-armed Bandit Approach to Learn and Select Users in Demand Response	Mar 20, 2020	AvgThompson Sampling	—Unverified	0
Delay-Adaptive Learning in Generalized Linear Contextual Bandits	Mar 11, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
Online Residential Demand Response via Contextual Multi-Armed Bandits	Mar 7, 2020	Decision MakingMulti-Armed Bandits	—Unverified	0
Odds-Ratio Thompson Sampling to Control for Time-Varying Effect	Mar 4, 2020	Thompson Sampling	CodeCode Available	0
MOTS: Minimax Optimal Thompson Sampling	Mar 3, 2020	Thompson Sampling	—Unverified	0
An Online Learning Framework for Energy-Efficient Navigation of Electric Vehicles	Mar 3, 2020	NavigateThompson Sampling	—Unverified	0
On Isometry Robustness of Deep 3D Point Cloud Models under Adversarial Attacks	Feb 27, 2020	Thompson Sampling	CodeCode Available	1
Efficient exploration of zero-sum stochastic games	Feb 24, 2020	Efficient ExplorationThompson Sampling	—Unverified	0
On Thompson Sampling with Langevin Algorithms	Feb 23, 2020	Thompson Sampling	—Unverified	0
Residual Bootstrap Exploration for Bandit Algorithms	Feb 19, 2020	Computational EfficiencyMulti-Armed Bandits	—Unverified	0
A General Theory of the Stochastic Linear Bandit and Its Applications	Feb 12, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
The Price of Incentivizing Exploration: A Characterization via Thompson Sampling and Sample Complexity	Feb 3, 2020	Multi-Armed BanditsThompson Sampling	—Unverified	0
Thompson Sampling Algorithms for Mean-Variance Bandits	Feb 1, 2020	Decision MakingThompson Sampling	CodeCode Available	0
Bayesian Quantile and Expectile Optimisation	Jan 12, 2020	Bayesian OptimisationGaussian Processes	—Unverified	0
On Thompson Sampling for Smoother-than-Lipschitz Bandits	Jan 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Making Sense of Reinforcement Learning and Probabilistic Inference	Jan 3, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 18 of 27Next →

No leaderboard results yet.