Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 1918 papers

Title	Date	Tasks	Status
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified
A Tutorial Introduction to Reinforcement Learning	Apr 3, 2023	Q-Learningreinforcement-learning	—Unverified
A Hysteretic Q-learning Coordination Framework for Emerging Mobility Systems in Smart Cities	Nov 5, 2020	Q-Learningreinforcement-learning	—Unverified
Adaptive Stochastic Resource Control: A Machine Learning Approach	Jan 15, 2014	BIG-bench Machine LearningClustering	—Unverified
Approximate Dynamic Oracle for Dependency Parsing with Reinforcement Learning	Nov 1, 2018	Dependency ParsingImitation Learning	—Unverified
Applying Reinforcement Learning to Option Pricing and Hedging	Oct 6, 2023	Q-Learningreinforcement-learning	—Unverified
Active Inference in Hebbian Learning Networks	Jun 8, 2023	OpenAI GymQ-Learning	—Unverified
Catalytic evolution of cooperation in a population with behavioural bimodality	Jun 17, 2024	Q-Learning	—Unverified
Application of Deep Reinforcement Learning to Payment Fraud	Dec 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Application of Deep Q-Network in Portfolio Management	Mar 13, 2020	Deep Reinforcement LearningFace Recognition	—Unverified
Adversarial Agents For Attacking Inaudible Voice Activated Devices	Jul 23, 2023	CyberBattleSimQ-Learning	—Unverified
Application of Deep Q Learning with Simulation Results for Elevator Optimization	Sep 30, 2022	Q-Learning	—Unverified
APF+: Boosting adaptive-potential function reinforcement learning methods with a W-shaped network for high-dimensional games	Mar 17, 2025	Atari GamesQ-Learning	—Unverified
Advancing Forest Fire Prevention: Deep Reinforcement Learning for Effective Firebreak Placement	Apr 12, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
Active Finite Reward Automaton Inference and Reinforcement Learning Using Queries and Counterexamples	Jun 28, 2020	Active LearningDeep Reinforcement Learning	—Unverified
A Penalized Shared-parameter Algorithm for Estimating Optimal Dynamic Treatment Regimens	Jul 13, 2021	Q-Learning	—Unverified
An Initial Introduction to Cooperative Multi-Agent Reinforcement Learning	May 10, 2024	MisconceptionsMulti-agent Reinforcement Learning	—Unverified
Advancing ECG Diagnosis Using Reinforcement Learning on Global Waveform Variations Related to P Wave and PR Interval	Jan 10, 2024	Q-LearningRhythm	—Unverified
AoI Minimization in Status Update Control with Energy Harvesting Sensors	Sep 9, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Anypath Routing Protocol Design via Q-Learning for Underwater Sensor Networks	Feb 22, 2020	Q-Learning	—Unverified
Advancing Algorithmic Trading: A Multi-Technique Enhancement of Deep Q-Network Models	Nov 9, 2023	Algorithmic TradingQ-Learning	—Unverified
Accelerating Goal-Directed Reinforcement Learning by Model Characterization	Jan 4, 2019	modelModel-based Reinforcement Learning	—Unverified
Multi-Objective Deep Reinforcement Learning for Optimisation in Autonomous Systems	Aug 2, 2024	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified
Catch Me If You Can: Improving Adversaries in Cyber-Security With Q-Learning Algorithms	Feb 7, 2023	Q-Learning	—Unverified
An Overview of Machine Learning-Enabled Optimization for Reconfigurable Intelligent Surfaces-Aided 6G Networks: From Reinforcement Learning to Large Language Models	May 9, 2024	Hierarchical Reinforcement LearningManagement	—Unverified
A Dual-Hormone Closed-Loop Delivery System for Type 1 Diabetes Using Deep Reinforcement Learning	Oct 9, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Can Q-learning solve Multi Armed Bantids?	Oct 21, 2021	Decision MakingQ-Learning	—Unverified
A Novel Resource Allocation for Anti-jamming in Cognitive-UAVs: an Active Inference Approach	Aug 10, 2022	Bayesian InferenceQ-Learning	—Unverified
A Novel Reinforcement Learning Model for Post-Incident Malware Investigations	Oct 19, 2024	Malware DetectionQ-Learning	—Unverified
Active Deep Q-learning with Demonstration	Dec 6, 2018	Q-Learningreinforcement-learning	—Unverified
A Novel Multi-Objective Reinforcement Learning Algorithm for Pursuit-Evasion Game	Mar 9, 2025	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
A Novel Deep Reinforcement Learning Based Stock Direction Prediction using Knowledge Graph and Community Aware Sentiments	Jul 2, 2021	Deep Reinforcement LearningPrediction	—Unverified
Accelerated Value Iteration via Anderson Mixing	Sep 27, 2018	Atari GamesQ-Learning	—Unverified
A Note on Target Q-learning For Solving Finite MDPs with A Generative Oracle	Mar 22, 2022	Q-Learning	—Unverified
An Optimization Method-Assisted Ensemble Deep Reinforcement Learning Algorithm to Solve Unit Commitment Problems	Jun 9, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
A Double Q-Learning Approach for Navigation of Aerial Vehicles with Connectivity Constraint	Feb 24, 2020	Q-LearningReinforcement Learning	—Unverified
Accelerated Target Updates for Q-learning	May 7, 2019	Atari GamesQ-Learning	—Unverified
Can Temporal-Difference and Q-Learning Learn Representation? A Mean-Field Theory	Jun 8, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
An Optimal Online Method of Selecting Source Policies for Reinforcement Learning	Sep 24, 2017	Q-Learningreinforcement-learning	—Unverified
A Distributional Analysis of Sampling-Based Reinforcement Learning Algorithms	Mar 27, 2020	Q-Learningreinforcement-learning	—Unverified
A Non-Asymptotic Theory of Seminorm Lyapunov Stability: From Deterministic to Stochastic Iterative Algorithms	Feb 20, 2025	Q-Learning	—Unverified
Anomaly Detection via Learning-Based Sequential Controlled Sensing	Nov 30, 2023	Anomaly DetectionDecision Making	—Unverified
Action Q-Transformer: Visual Explanation in Deep Reinforcement Learning with Encoder-Decoder Model using Action Query	Jun 24, 2023	Atari GamesDecision Making	—Unverified
Action-modulated midbrain dopamine activity arises from distributed control policies	Jul 1, 2022	Q-Learningreinforcement-learning	—Unverified
An MDP Model for Censoring in Harvesting Sensors: Optimal and Approximated Solutions	Feb 2, 2025	Q-Learning	—Unverified
A Differentiable Physics Engine for Deep Learning in Robotics	Nov 5, 2016	CPUDeep Learning	—Unverified
A Deep Reinforcement Learning Trader without Offline Training	Mar 1, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
An Index Policy Based on Sarsa and Q-learning for Heterogeneous Smart Target Tracking	Feb 19, 2024	Q-LearningScheduling	—Unverified
An Independent Study of Reinforcement Learning and Autonomous Driving	Aug 20, 2021	Autonomous DrivingOpenAI Gym	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified

Show:10 25 50

← PrevPage 6 of 39Next →

No leaderboard results yet.