Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1918 papers

Title	Date	Tasks	Status
Q-Learning Inspired Self-Tuning for Energy Efficiency in HPC	Jun 26, 2019	Q-Learning	—Unverified
Q-learning optimization in a multi-agents system for image segmentation	Nov 23, 2013	Image SegmentationQ-Learning	—Unverified
Q-learning pour la r\'esolution des anaphores pronominales en langue arabe (Q-learning for pronominal anaphora resolution in Arabic texts)	Jul 1, 2019	Q-Learning	—Unverified
Q-Learning Scheduler for Multi-Task Learning through the use of Histogram of Task Uncertainty	Sep 29, 2021	Multi-Task LearningQ-Learning	—Unverified
Q-Learning Scheduler for Multi Task Learning Through the use of Histogram of Task Uncertainty	May 1, 2022	Multi-Task LearningQ-Learning	—Unverified
Q-learning with temporal memory to navigate turbulence	Apr 26, 2024	Decision MakingNavigate	—Unverified
Q-Learning with Basic Emotions	Sep 6, 2016	Q-Learning	—Unverified
Q-Learning with Clustered-SMART (cSMART) Data: Examining Moderators in the Construction of Clustered Adaptive Interventions	May 1, 2025	Q-Learning	—Unverified
Q-Learning with Differential Entropy of Q-Tables	Jun 26, 2020	Q-Learning	—Unverified
Q-learning with Logarithmic Regret	Jun 16, 2020	Q-Learning	—Unverified
Q-learning with Nearest Neighbors	Feb 12, 2018	Q-LearningReinforcement Learning	—Unverified
Q-learning with online random forests	Apr 7, 2022	Q-Learningreinforcement-learning	—Unverified
Q-learning with UCB Exploration is Sample Efficient for Infinite-Horizon MDP	Jan 27, 2019	Q-LearningReinforcement Learning	—Unverified
Q-learning with Uniformly Bounded Variance: Large Discounting is Not a Barrier to Fast Learning	Feb 24, 2020	Q-LearningReinforcement Learning	—Unverified
Q-MIND: Defeating Stealthy DoS Attacks in SDN with a Machine-learning based Defense Framework	Jul 27, 2019	Anomaly DetectionBIG-bench Machine Learning	—Unverified
Q-Networks for Binary Vector Actions	Dec 4, 2015	Q-Learningreinforcement-learning	—Unverified
QoS-Aware Power Minimization of Distributed Many-Core Servers using Transfer Q-Learning	Feb 2, 2021	Q-Learning	—Unverified
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified
Q-SMASH: Q-Learning-based Self-Adaptation of Human-Centered Internet of Things	Jul 13, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions	Sep 18, 2023	Imitation LearningOffline RL	—Unverified
QT-TDM: Planning With Transformer Dynamics Model and Autoregressive Q-Learning	Jul 26, 2024	continuous-controlContinuous Control	—Unverified
Quadratic Q-network for Learning Continuous Control for Autonomous Vehicles	Nov 29, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified
Quantile QT-Opt for Risk-Aware Vision-Based Robotic Grasping	Oct 1, 2019	Q-LearningReinforcement Learning	—Unverified
Quantitative Trading using Deep Q Learning	Apr 3, 2023	Q-Learningreinforcement-learning	—Unverified
Quantum Architecture Search via Continual Reinforcement Learning	Dec 10, 2021	Continual LearningDeep Reinforcement Learning	—Unverified
Quantum deep Q learning with distributed prioritized experience replay	Apr 19, 2023	Q-Learningreinforcement-learning	—Unverified
Quantum deep recurrent reinforcement learning	Oct 26, 2022	Decision MakingQ-Learning	—Unverified
Quantum-Inspired Reinforcement Learning in the Presence of Epistemic Ambivalence	Mar 6, 2025	Decision MakingDecision Making Under Uncertainty	—Unverified
Quantum Observables for continuous control of the Quantum Approximate Optimization Algorithm via Reinforcement Learning	Nov 21, 2019	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning via L-BFGS Optimization	Nov 6, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Q-WSL: Optimizing Goal-Conditioned RL with Weighted Supervised Learning via Dynamic Programming	Oct 9, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Reward Prediction Error as an Exploration Objective in Deep RL	Jun 19, 2019	Atari GamesContinuous Control	—Unverified
QXplore: Q-Learning Exploration by Maximizing Temporal Difference Error	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Random-Key Algorithms for Optimizing Integrated Operating Room Scheduling	Jan 17, 2025	Combinatorial OptimizationDecoder	—Unverified
Rank-One Modified Value Iteration	May 3, 2025	Q-Learning	—Unverified
RansomAI: AI-powered Ransomware for Stealthy Encryption	Jun 27, 2023	Q-LearningRaspberry Pi 4	—Unverified
RCsearcher: Reaction Center Identification in Retrosynthesis via Deep Q-Learning	Jan 28, 2023	Deep Reinforcement LearningGraph Neural Network	—Unverified
Real-time Active Vision for a Humanoid Soccer Robot Using Deep Reinforcement Learning	Nov 27, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Realtime Spectrum Monitoring via Reinforcement Learning -- A Comparison Between Q-Learning and Heuristic Methods	Jul 11, 2023	ManagementQ-Learning	—Unverified
Real-World Offline Reinforcement Learning from Vision Language Model Feedback	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified
Recurrent Neural Network-based Anti-jamming Framework for Defense Against Multiple Jamming Policies	Aug 19, 2022	Q-Learning	—Unverified
Recursive Backwards Q-Learning in Deterministic Environments	Apr 24, 2024	Q-Learning	—Unverified
Recursive Reinforcement Learning	Jun 23, 2022	IngenuityQ-Learning	—Unverified
Preventing Value Function Collapse in Ensemble Q-Learning by Maximizing Representation Diversity	Jun 24, 2020	DiversityQ-Learning	—Unverified
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage	Feb 5, 2023	Offline RLQ-Learning	—Unverified
Regret Bounds for Discounted MDPs	Feb 12, 2020	Q-LearningReinforcement Learning	—Unverified
Regret of exploratory policy improvement and q-learning	Nov 2, 2024	Q-Learning	—Unverified
Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning	Jun 5, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Regularize! Don't Mix: Multi-Agent Reinforcement Learning without Explicit Centralized Structures	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Regularized Q-learning	Feb 11, 2022	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 22 of 39Next →

No leaderboard results yet.