Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1325 of 1918 papers

Title	Date	Tasks	Status
Stochastic Approximation with Unbounded Markovian Noise: A General-Purpose Theorem	Oct 29, 2024	Q-LearningStochastic Optimization	—Unverified
Stochastic Gradient Descent with Dependent Data for Offline Reinforcement Learning	Feb 6, 2022	Q-Learningreinforcement-learning	—Unverified
Stochastic Lipschitz Q-Learning	Apr 24, 2019	Q-LearningReinforcement Learning	—Unverified
Stochastic Q-learning for Large Discrete Action Spaces	May 16, 2024	Decision MakingQ-Learning	—Unverified
Stochastic Variance Reduction for Deep Q-learning	May 20, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Strategizing against Q-learners: A Control-theoretical Approach	Mar 13, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Striving for Simplicity in Off-Policy Deep Reinforcement Learning	Sep 25, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Structural Similarity for Improved Transfer in Reinforcement Learning	Jul 27, 2022	Q-Learningreinforcement-learning	—Unverified
Structured Q-learning For Antibody Design	Sep 10, 2022	Combinatorial OptimizationMolecular Docking	—Unverified
Structure Learning of Deep Neural Networks with Q-Learning	Oct 31, 2018	image-classificationImage Classification	—Unverified
Structure learning with Temporal Gaussian Mixture for model-based Reinforcement Learning	Nov 18, 2024	Decision MakingModel-based Reinforcement Learning	—Unverified
Successive Over Relaxation Q-Learning	Mar 9, 2019	Q-LearningReinforcement Learning	—Unverified
Success-Rate Targeted Reinforcement Learning by Disorientation Penalty	Jan 1, 2021	Decision MakingQ-Learning	—Unverified
Sufficient Exploration for Convex Q-learning	Oct 17, 2022	OpenAI GymQ-Learning	—Unverified
Supervised Advantage Actor-Critic for Recommender Systems	Nov 5, 2021	Q-LearningRecommendation Systems	—Unverified
Supervised Q-walk for Learning Vector Representation of Nodes in Networks	Oct 3, 2017	ClassificationGeneral Classification	—Unverified
Suppressing Overestimation in Q-Learning through Adversarial Behaviors	Oct 10, 2023	Q-Learning	—Unverified
Survey on Multi-Agent Q-Learning frameworks for resource management in wireless sensor network	May 5, 2021	ManagementQ-Learning	—Unverified
SVQN: Sequential Variational Soft Q-Learning Networks	Jan 1, 2020	Decision MakingQ-Learning	—Unverified
Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning	Mar 12, 2024	continuous-controlContinuous Control	—Unverified
Tabular and Deep Learning for the Whittle Index	Jun 4, 2024	Deep LearningQ-Learning	—Unverified
Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning	Jun 30, 2024	D4RLOffline RL	—Unverified
Tactical Reward Shaping: Bypassing Reinforcement Learning with Strategy-Based Goals	Oct 8, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Taming Lagrangian Chaos with Multi-Objective Reinforcement Learning	Dec 19, 2022	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Target-Based Temporal Difference Learning	Apr 24, 2019	Q-LearningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 53 of 77Next →

No leaderboard results yet.