SOTAVerified|Agents Browse Leaderboard About Blog

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 1918 papers

Title	Date	Tasks	Status	Score
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available	5
Estimation Error Correction in Deep Reinforcement Learning for Deterministic Actor-Critic Methods	Sep 22, 2021	continuous-controlContinuous Control	CodeCode Available	5
Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks	Nov 21, 2022	Q-Learningreinforcement-learning	CodeCode Available	5
Enhancing Robot Assistive Behaviour with Reinforcement Learning and Theory of Mind	Nov 11, 2024	Q-Learning	CodeCode Available	5
Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy Improvement	Oct 22, 2018	Policy Gradient MethodsQ-Learning	CodeCode Available	5
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning	Jul 5, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization	Dec 10, 2023	Q-LearningReinforcement Learning (RL)	CodeCode Available	5
Efficient Model-free Reinforcement Learning in Metric Spaces	May 1, 2019	Q-Learningreinforcement-learning	CodeCode Available	5
Explainable and Safe Reinforcement Learning for Autonomous Air Mobility	Nov 24, 2022	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	5
Dynamic control of self-assembly of quasicrystalline structures through reinforcement learning	Sep 13, 2023	Q-Learningreinforcement-learning	CodeCode Available	5
A Fairness-Oriented Reinforcement Learning Approach for the Operation and Control of Shared Micromobility Services	Mar 23, 2024	FairnessQ-Learning	CodeCode Available	5
DynamicLight: Two-Stage Dynamic Traffic Signal Timing	Nov 2, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available	5
Adversarial Learning of a Sampler Based on an Unnormalized Distribution	Jan 3, 2019	FormQ-Learning	CodeCode Available	5
Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer	Feb 4, 2025	Q-LearningSMAC	CodeCode Available	5
Double Q-PID algorithm for mobile robot control	Nov 1, 2018	Active LearningQ-Learning	CodeCode Available	5
Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning	Sep 10, 2024	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
Active exploration in parameterized reinforcement learning	Oct 6, 2016	Meta-LearningQ-Learning	CodeCode Available	5
Diagnosing Bottlenecks in Deep Q-learning Algorithms	Feb 26, 2019	continuous-controlContinuous Control	CodeCode Available	5
DRL4AOI: A DRL Framework for Semantic-aware AOI Segmentation in Location-Based Services	Dec 6, 2024	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management	Feb 18, 2018	Deep Reinforcement LearningManagement	CodeCode Available	5
Exploring reinforcement learning techniques for discrete and continuous control tasks in the MuJoCo environment	Jul 20, 2023	continuous-controlContinuous Control	CodeCode Available	5
Distributed-Training-and-Execution Multi-Agent Reinforcement Learning for Power Control in HetNet	Dec 15, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	5
Distributionally Robust Deep Q-Learning	May 25, 2025	Q-Learning	CodeCode Available	5
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available	5
Deep-Q Learning with Hybrid Quantum Neural Network on Solving Maze Problems	Apr 20, 2023	Q-Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 8 of 77Next →

No leaderboard results yet.