Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 1918 papers

Title	Date	Tasks	Status	Hype	Score
Optimistic Exploration even with a Pessimistic Initialisation	Feb 26, 2020	Efficient ExplorationQ-Learning	CodeCode Available	1	5
Optimistic Multi-Agent Policy Gradient	Nov 3, 2023	MuJoCoQ-Learning	CodeCode Available	1	5
Coarse-to-Fine Q-attention: Efficient Learning for Visual Robotic Manipulation via Discretisation	Jun 23, 2021	Continuous ControlQ-Learning	CodeCode Available	1	5
Heuristics, Answer Set Programming and Markov Decision Process for Solving a Set of Spatial Puzzles	Feb 16, 2019	Q-LearningReinforcement Learning	CodeCode Available	0	5
Hierarchical Cooperative Multi-Agent Reinforcement Learning with Skill Discovery	Dec 7, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0	5
Autoequivariant Network Search via Group Decomposition	Apr 10, 2021	Inductive BiasNeural Architecture Search	CodeCode Available	0	5
Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL	Jul 20, 2024	Few-Shot Text ClassificationQ-Learning	CodeCode Available	0	5
Hierarchical Reinforcement Learning with the MAXQ Value Function Decomposition	May 21, 1999	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available	0	5
Goal Recognition as Reinforcement Learning	Feb 13, 2022	Q-Learningreinforcement-learning	CodeCode Available	0	5
Graph Backup: Data Efficient Backup Exploiting Markovian Transitions	May 31, 2022	Atari Gamescounterfactual	CodeCode Available	0	5
GHQ: Grouped Hybrid Q Learning for Heterogeneous Cooperative Multi-agent Reinforcement Learning	Mar 2, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0	5
Generating a Graph Colouring Heuristic with Deep Q-Learning and Graph Neural Networks	Apr 8, 2023	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	0	5
Goal-Conditioned Q-Learning as Knowledge Distillation	Aug 28, 2022	Knowledge DistillationQ-Learning	CodeCode Available	0	5
Group Equivariant Deep Reinforcement Learning	Jul 1, 2020	Deep Reinforcement LearningInductive Bias	CodeCode Available	0	5
From Two-Dimensional to Three-Dimensional Environment with Q-Learning: Modeling Autonomous Navigation with Reinforcement Learning and no Libraries	Mar 27, 2024	Autonomous NavigationDecision Making	CodeCode Available	0	5
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	0	5
Generalized Speedy Q-learning	Nov 1, 2019	Q-LearningReinforcement Learning	CodeCode Available	0	5
Agent Performing Autonomous Stock Trading under Good and Bad Situations	Jun 6, 2023	Decision MakingDeep Reinforcement Learning	CodeCode Available	0	5
Adaptive Discretization for Episodic Reinforcement Learning in Metric Spaces	Oct 17, 2019	Q-Learningreinforcement-learning	CodeCode Available	0	5
Factors of Influence of the Overestimation Bias of Q-Learning	Oct 11, 2022	Q-Learning	CodeCode Available	0	5
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction	Jun 3, 2019	continuous-controlContinuous Control	CodeCode Available	0	5
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available	0	5
Generalized Value Iteration Networks: Life Beyond Lattices	Jun 8, 2017	Q-Learning	CodeCode Available	0	5
AFU: Actor-Free critic Updates in off-policy RL for continuous control	Apr 24, 2024	continuous-controlContinuous Control	CodeCode Available	0	5
Evolution of cooperation in a bimodal mixture of conditional cooperators	Feb 11, 2025	Q-Learning	CodeCode Available	0	5
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available	0	5
Estimation Error Correction in Deep Reinforcement Learning for Deterministic Actor-Critic Methods	Sep 22, 2021	continuous-controlContinuous Control	CodeCode Available	0	5
Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks	Nov 21, 2022	Q-Learningreinforcement-learning	CodeCode Available	0	5
Enhancing Robot Assistive Behaviour with Reinforcement Learning and Theory of Mind	Nov 11, 2024	Q-Learning	CodeCode Available	0	5
Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy Improvement	Oct 22, 2018	Policy Gradient MethodsQ-Learning	CodeCode Available	0	5
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning	Jul 5, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	0	5
Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization	Dec 10, 2023	Q-LearningReinforcement Learning (RL)	CodeCode Available	0	5
Efficient Model-free Reinforcement Learning in Metric Spaces	May 1, 2019	Q-Learningreinforcement-learning	CodeCode Available	0	5
Explainable and Safe Reinforcement Learning for Autonomous Air Mobility	Nov 24, 2022	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	0	5
Dynamic control of self-assembly of quasicrystalline structures through reinforcement learning	Sep 13, 2023	Q-Learningreinforcement-learning	CodeCode Available	0	5
A Fairness-Oriented Reinforcement Learning Approach for the Operation and Control of Shared Micromobility Services	Mar 23, 2024	FairnessQ-Learning	CodeCode Available	0	5
DynamicLight: Two-Stage Dynamic Traffic Signal Timing	Nov 2, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available	0	5
Adversarial Learning of a Sampler Based on an Unnormalized Distribution	Jan 3, 2019	FormQ-Learning	CodeCode Available	0	5
Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer	Feb 4, 2025	Q-LearningSMAC	CodeCode Available	0	5
Double Q-PID algorithm for mobile robot control	Nov 1, 2018	Active LearningQ-Learning	CodeCode Available	0	5
Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning	Sep 10, 2024	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	0	5
Active exploration in parameterized reinforcement learning	Oct 6, 2016	Meta-LearningQ-Learning	CodeCode Available	0	5
Diagnosing Bottlenecks in Deep Q-learning Algorithms	Feb 26, 2019	continuous-controlContinuous Control	CodeCode Available	0	5
DRL4AOI: A DRL Framework for Semantic-aware AOI Segmentation in Location-Based Services	Dec 6, 2024	Deep Reinforcement LearningQ-Learning	CodeCode Available	0	5
Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management	Feb 18, 2018	Deep Reinforcement LearningManagement	CodeCode Available	0	5
Exploring reinforcement learning techniques for discrete and continuous control tasks in the MuJoCo environment	Jul 20, 2023	continuous-controlContinuous Control	CodeCode Available	0	5
Distributed-Training-and-Execution Multi-Agent Reinforcement Learning for Power Control in HetNet	Dec 15, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	0	5
Distributionally Robust Deep Q-Learning	May 25, 2025	Q-Learning	CodeCode Available	0	5
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available	0	5
Deep-Q Learning with Hybrid Quantum Neural Network on Solving Maze Problems	Apr 20, 2023	Q-Learningreinforcement-learning	CodeCode Available	0	5

Show:10 25 50

← PrevPage 4 of 39Next →

No leaderboard results yet.