Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1918 papers

Title	Date	Tasks	Status
Hidden Markov Model Estimation-Based Q-learning for Partially Observable Markov Decision Process	Sep 17, 2018	Q-Learning	—Unverified
Hierarchical clustering with deep Q-learning	May 28, 2018	ClusteringQ-Learning	—Unverified
Hierarchical Deep Q-Learning Based Handover in Wireless Networks with Dual Connectivity	Jan 13, 2023	Q-Learningreinforcement-learning	—Unverified
Hierarchical Modular Reinforcement Learning Method and Knowledge Acquisition of State-Action Rule for Multi-target Problem	Apr 8, 2018	PositionQ-Learning	—Unverified
High dimensional precision medicine from patient-derived xenografts	Dec 13, 2019	Q-LearningVocal Bursts Intensity Prediction	—Unverified
High-Dimensional Stock Portfolio Trading with Deep Reinforcement Learning	Dec 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Highway Reinforcement Learning	May 28, 2024	Q-Learningreinforcement-learning	—Unverified
Hippocampal representations emerge when training recurrent neural networks on a memory dependent maze navigation task	Dec 2, 2020	HippocampusQ-Learning	—Unverified
How to discretize continuous state-action spaces in Q-learning: A symbolic control approach	Jun 3, 2024	Q-Learning	—Unverified
Human and Multi-Agent collaboration in a human-MARL teaming framework	Jun 12, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Hybridizing the 1/5-th Success Rule with Q-Learning for Controlling the Mutation Rate of an Evolutionary Algorithm	Jun 19, 2020	Evolutionary AlgorithmsQ-Learning	—Unverified
Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving	Oct 11, 2024	Autonomous DrivingDecision Making	—Unverified
Hybrid Policies Using Inverse Rewards for Reinforcement Learning	Sep 27, 2018	OpenAI GymQ-Learning	—Unverified
Hybrid Q-Learning Applied to Ubiquitous recommender system	Mar 10, 2013	Q-LearningRecommendation Systems	—Unverified
Hyperparameter Optimization for Tracking With Continuous Deep Q-Learning	Jun 1, 2018	Hyperparameter OptimizationObject Tracking	—Unverified
HyperQ-Opt: Q-learning for Hyperparameter Optimization	Dec 23, 2024	Bayesian OptimizationHyperparameter Optimization	—Unverified
Identification and Off-Policy Learning of Multiple Objectives Using Adaptive Clustering	May 17, 2017	ClusteringQ-Learning	—Unverified
Ignorance is Bliss: Robust Control via Information Gating	Mar 10, 2023	Inductive BiasQ-Learning	—Unverified
Imagination-Limited Q-Learning for Offline Reinforcement Learning	May 18, 2025	D4RLQ-Learning	—Unverified
Imitating Language via Scalable Inverse Reinforcement Learning	Sep 2, 2024	DiversityImitation Learning	—Unverified
Implementing Inductive bias for different navigation tasks through diverse RNN attrractors	May 1, 2020	Inductive BiasQ-Learning	—Unverified
Implicit Constraint-Aware Off-Policy Correction for Offline Reinforcement Learning	Jun 16, 2025	Q-Learning	—Unverified
Improved Q-learning based Multi-hop Routing for UAV-Assisted Communication	Aug 17, 2024	Collision AvoidanceQ-Learning	—Unverified
Improve Value Estimation of Q Function and Reshape Reward with Monte Carlo Tree Search	Oct 15, 2024	Q-Learning	—Unverified
Improving Performance of Spike-based Deep Q-Learning using Ternary Neurons	Jun 3, 2025	Atari GamesDecision Making	—Unverified
Improving Search through A3C Reinforcement Learning based Conversational Agent	Sep 17, 2017	Q-Learningreinforcement-learning	—Unverified
Improving the Diversity of Bootstrapped DQN by Replacing Priors With Noise	Mar 2, 2022	Atari GamesDiversity	—Unverified
I'm sorry Dave, I'm afraid I can't do that, Deep Q-learning from forbidden action	Oct 4, 2019	Industrial RobotsQ-Learning	—Unverified
Indirect and Direct Training of Spiking Neural Networks for End-to-End Control of a Lane-Keeping Vehicle	Mar 10, 2020	Q-LearningReinforcement Learning	—Unverified
Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning	Mar 18, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Information Maximizing Exploration with a Latent Dynamics Model	Apr 4, 2018	continuous-controlContinuous Control	—Unverified
Information Theoretic Model Predictive Q-Learning	Dec 31, 2019	Decision Makingmodel	—Unverified
In Hindsight: A Smooth Reward for Steady Exploration	Jun 24, 2019	Atari GamesQ-Learning	—Unverified
In Search for Architectures and Loss Functions in Multi-Objective Reinforcement Learning	Jul 23, 2024	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Instance-optimality in optimal value estimation: Adaptivity via variance-reduced Q-learning	Jun 28, 2021	Q-Learning	—Unverified
Integrated Freeway Traffic Control Using Q-Learning with Adjacent Arterial Traffic Considerations	Oct 25, 2023	Q-Learning	—Unverified
Integrated Sensing and Communication Neighbor Discovery for MANET with Gossip Mechanism	Oct 11, 2023	Integrated sensing and communicationISAC	—Unverified
Integrated trucks assignment and scheduling problem with mixed service mode docks: A Q-learning based adaptive large neighborhood search algorithm	Dec 12, 2024	Q-LearningScheduling	—Unverified
Integrating Behavior Cloning and Reinforcement Learning for Improved Performance in Dense and Sparse Reward Environments	Oct 9, 2019	Q-Learningreinforcement-learning	—Unverified
Integrating Deep Learning and Augmented Reality to Enhance Situational Awareness in Firefighting Environments	Jul 23, 2021	Anomaly Detectionobject-detection	—Unverified
Intelligent Agricultural Management Considering N_2O Emission and Climate Variability with Uncertainties	Feb 13, 2024	Decision MakingManagement	—Unverified
Intelligent Autonomous Intersection Management	Feb 9, 2022	Autonomous VehiclesManagement	—Unverified
Intelligent O-RAN Traffic Steering for URLLC Through Deep Reinforcement Learning	Mar 3, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Intelligent Querying for Target Tracking in Camera Networks using Deep Q-Learning with n-Step Bootstrapping	Apr 20, 2020	Q-LearningReinforcement Learning	—Unverified
Interactive Double Deep Q-network: Integrating Human Interventions and Evaluative Predictions in Reinforcement Learning of Autonomous Driving	Apr 28, 2025	Autonomous DrivingQ-Learning	—Unverified
Interactive Learning from Natural Language and Demonstrations using Signal Temporal Logic	Jul 1, 2022	Formal LogicQ-Learning	—Unverified
Interactive Spoken Content Retrieval by Deep Reinforcement Learning	Sep 16, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
Internet of Things Applications: Animal Monitoring with Unmanned Aerial Vehicle	Oct 17, 2016	Q-LearningTraveling Salesman Problem	—Unverified
Deep Constrained Q-learning	Mar 20, 2020	Autonomous DrivingDecision Making	—Unverified
Interpretable Option Discovery using Deep Q-Learning and Variational Autoencoders	Oct 3, 2022	Deep Reinforcement LearningQ-Learning	—Unverified

Show:10 25 50

← PrevPage 23 of 39Next →

No leaderboard results yet.