Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–425 of 1918 papers

Title	Date	Tasks	Status	Score
Playing FPS Games with Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available	5
Policy Learning for Malaria Control	Oct 20, 2019	Bayesian OptimizationDecision Making	CodeCode Available	5
Automaton-Guided Curriculum Generation for Reinforcement Learning Agents	Apr 11, 2023	Decision MakingQ-Learning	CodeCode Available	5
ADDQ: Adaptive Distributional Double Q-Learning	Jun 24, 2025	Distributional Reinforcement LearningMuJoCo	CodeCode Available	5
POPO: Pessimistic Offline Policy Optimization	Dec 26, 2020	Offline RLQ-Learning	CodeCode Available	5
Learning to Play Text-based Adventure Games with Maximum Entropy Reinforcement Learning	Feb 21, 2023	Q-Learningreinforcement-learning	CodeCode Available	5
A Fairness-Oriented Reinforcement Learning Approach for the Operation and Control of Shared Micromobility Services	Mar 23, 2024	FairnessQ-Learning	CodeCode Available	5
Pre-training with Synthetic Data Helps Offline Reinforcement Learning	Oct 1, 2023	D4RLDeep Reinforcement Learning	CodeCode Available	5
Privacy-preserving Q-Learning with Functional Noise in Continuous State Spaces	Jan 30, 2019	Privacy PreservingQ-Learning	CodeCode Available	5
Probing Implicit Bias in Semi-gradient Q-learning: Visualizing the Effective Loss Landscapes via the Fokker--Planck Equation	Jun 12, 2024	Q-Learning	CodeCode Available	5
Provably efficient RL with Rich Observations via Latent State Decoding	Jan 25, 2019	ClusteringQ-Learning	CodeCode Available	5
Deep Q-Learning based Reinforcement Learning Approach for Network Intrusion Detection	Nov 27, 2021	Intrusion DetectionNetwork Intrusion Detection	CodeCode Available	5
Approximating two value functions instead of one: towards characterizing a new family of Deep Reinforcement Learning algorithms	Sep 1, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Q-Distribution guided Q-learning for offline reinforcement learning: Uncertainty penalized Q-value via consistency model	Oct 27, 2024	D4RLQ-Learning	CodeCode Available	5
DeepQTest: Testing Autonomous Driving Systems with Reinforcement Learning and Real-world Weather Data	Oct 8, 2023	Autonomous DrivingQ-Learning	CodeCode Available	5
Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning	Dec 18, 2017	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available	5
Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic	Nov 7, 2016	continuous-controlContinuous Control	CodeCode Available	5
Deep Ordinal Reinforcement Learning	May 6, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
A Comparison of Reward Functions in Q-Learning Applied to a Cart Position Problem	May 25, 2021	PositionQ-Learning	CodeCode Available	5
Deep Jump Learning for Off-Policy Evaluation in Continuous Treatment Settings	Oct 29, 2020	Change Point DetectionOff-policy evaluation	CodeCode Available	5
Deep Q-learning: a robust control approach	Jan 21, 2022	OpenAI GymQ-Learning	CodeCode Available	5
Deep Quality-Value (DQV) Learning	Sep 30, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Automatic Data Augmentation by Learning the Deterministic Policy	Oct 18, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	5
A Kernel Loss for Solving the Bellman Equation	May 25, 2019	Q-LearningReinforcement Learning	CodeCode Available	5
Automata Learning meets Shielding	Dec 4, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 17 of 77Next →

No leaderboard results yet.