SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–725 of 1918 papers

Title	Date	Tasks	Status
A Differentiable Physics Engine for Deep Learning in Robotics	Nov 5, 2016	CPUDeep Learning	—Unverified
Evaluation of Reinforcement Learning for Autonomous Penetration Testing using A3C, Q-learning and DQN	Jul 22, 2024	Decision MakingQ-Learning	—Unverified
Collaborative Deep Reinforcement Learning for Joint Object Search	Feb 18, 2017	Active Object LocalizationDeep Reinforcement Learning	—Unverified
Evaluation of Reinforcement Learning Techniques for Trading on a Diverse Portfolio	Jun 28, 2023	Q-Learningreinforcement-learning	—Unverified
Evaluating Reinforcement Learning Algorithms for Navigation in Simulated Robotic Quadrupeds: A Comparative Study Inspired by Guide Dog Behaviour	Jul 17, 2025	Autonomous NavigationQ-Learning	—Unverified
An Index Policy Based on Sarsa and Q-learning for Heterogeneous Smart Target Tracking	Feb 19, 2024	Q-LearningScheduling	—Unverified
Evaluating Load Models and Their Impacts on Power Transfer Limits	Aug 7, 2020	Q-Learning	—Unverified
Escaping the State of Nature: A Hobbesian Approach to Cooperation in Multi-agent Reinforcement Learning	Jun 5, 2019	Multi-agent Reinforcement LearningPhilosophy	—Unverified
Equivariant Offline Reinforcement Learning	Jun 20, 2024	Offline RLQ-Learning	—Unverified
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified
An Independent Study of Reinforcement Learning and Autonomous Driving	Aug 20, 2021	Autonomous DrivingOpenAI Gym	—Unverified
Evolution of Q Values for Deep Q Learning in Stable Baselines	Apr 24, 2020	Q-LearningReinforcement Learning	—Unverified
A Deep Reinforcement Learning Trader without Offline Training	Mar 1, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Action-modulated midbrain dopamine activity arises from distributed control policies	Jul 1, 2022	Q-Learningreinforcement-learning	—Unverified
Accelerated Target Updates for Q-learning	May 7, 2019	Atari GamesQ-Learning	—Unverified
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
Expert Q-learning: Deep Reinforcement Learning with Coarse State Values from Offline Expert Examples	Jun 28, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Episodic Exploration for Deep Deterministic Policies: An Application to StarCraft Micromanagement Tasks	Sep 10, 2016	Q-Learningreinforcement-learning	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Exploration, Exploitation, and Engagement in Multi-Armed Bandits with Abandonment	May 26, 2022	Multi-Armed BanditsQ-Learning	—Unverified
Chrome Dino Run using Reinforcement Learning	Aug 15, 2020	Q-Learningreinforcement-learning	—Unverified
Exploration in Knowledge Transfer Utilizing Reinforcement Learning	Jul 15, 2024	Q-Learningreinforcement-learning	—Unverified
Entropy-Augmented Entropy-Regularized Reinforcement Learning and a Continuous Path from Policy Gradient to Q-Learning	May 18, 2020	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 29 of 77Next →

No leaderboard results yet.