Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 1918 papers

Title	Date	Tasks	Status
Reinforcement Learning for Learning of Dynamical Systems in Uncertain Environment: a Tutorial	May 19, 2019	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Mean Field Games, with Applications to Economics	Jun 25, 2021	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Mixed-Integer Problems Based on MPC	Apr 3, 2020	Model Predictive ControlQ-Learning	—Unverified
Reinforcement Learning for Online Testing of Autonomous Driving Systems: a Replication and Extension Study	Mar 20, 2024	Autonomous DrivingQ-Learning	—Unverified
Reinforcement Learning for Optimal Control of a District Cooling Energy Plant	Mar 14, 2022	Model Predictive ControlQ-Learning	—Unverified
Reinforcement Learning for Optimal Execution when Liquidity is Time-Varying	Feb 19, 2024	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Quantum Circuit Design: Using Matrix Representations	Jan 27, 2025	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning for Rate Maximization in IRS-aided OWC Networks	Sep 7, 2024	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Resilient Power Grids	Dec 8, 2022	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Resource Allocation in Steerable Laser-based Optical Wireless Systems	Jun 21, 2021	ManagementQ-Learning	—Unverified
Reinforcement Learning for Robotics and Control with Active Uncertainty Reduction	May 15, 2019	ManagementOpenAI Gym	—Unverified
Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer	Feb 4, 2025	Q-LearningSMAC	CodeCode Available
Sample Efficient Reinforcement Learning with Partial Dynamics Knowledge	Dec 19, 2023	Q-Learningreinforcement-learning	CodeCode Available
Dynamic control of self-assembly of quasicrystalline structures through reinforcement learning	Sep 13, 2023	Q-Learningreinforcement-learning	CodeCode Available
AFU: Actor-Free critic Updates in off-policy RL for continuous control	Apr 24, 2024	continuous-controlContinuous Control	CodeCode Available
DynamicLight: Two-Stage Dynamic Traffic Signal Timing	Nov 2, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning Based Parameter Control in Differential Evolution	May 20, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
A Semantic-Aware Multiple Access Scheme for Distributed, Dynamic 6G-Based Applications	Jan 12, 2024	Decision MakingDeep Reinforcement Learning	CodeCode Available
Learning Heuristics over Large Graphs via Deep Reinforcement Learning	Mar 8, 2019	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction	Jun 3, 2019	continuous-controlContinuous Control	CodeCode Available
Reinforcement Learning for Physical Layer Communications	Jun 22, 2021	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available
Task and Model Agnostic Adversarial Attack on Graph Neural Networks	Dec 25, 2021	Adversarial AttackQ-Learning	CodeCode Available
Towards Better Interpretability in Deep Q-Networks	Sep 15, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available
Stabilizing Extreme Q-learning by Maclaurin Expansion	Jun 7, 2024	D4RLOffline RL	CodeCode Available
Learning Principle of Least Action with Reinforcement Learning	Nov 24, 2020	Q-Learningreinforcement-learning	CodeCode Available
Learning RL-Policies for Joint Beamforming Without Exploration: A Batch Constrained Off-Policy Approach	Oct 12, 2023	Deep Reinforcement LearningQ-Learning	CodeCode Available
Scalable Online Exploration via Coverability	Mar 11, 2024	Efficient ExplorationQ-Learning	CodeCode Available
DRL4AOI: A DRL Framework for Semantic-aware AOI Segmentation in Location-Based Services	Dec 6, 2024	Deep Reinforcement LearningQ-Learning	CodeCode Available
Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management	Feb 18, 2018	Deep Reinforcement LearningManagement	CodeCode Available
ZPD Teaching Strategies for Deep Reinforcement Learning from Demonstrations	Oct 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Efficient Model-free Reinforcement Learning in Metric Spaces	May 1, 2019	Q-Learningreinforcement-learning	CodeCode Available
Reinforcement Learning for Sampling on Temporal Medical Imaging Sequences	Aug 28, 2023	Image ReconstructionQ-Learning	CodeCode Available
Towards Empathic Deep Q-Learning	Jun 26, 2019	EthicsQ-Learning	CodeCode Available
Learning Simple Algorithms from Examples	Nov 23, 2015	Q-Learning	CodeCode Available
Learning State Abstractions for Transfer in Continuous Control	Feb 8, 2020	continuous-controlContinuous Control	CodeCode Available
Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization	Dec 10, 2023	Q-LearningReinforcement Learning (RL)	CodeCode Available
Schrödinger's Camera: First Steps Towards a Quantum-Based Privacy Preserving Camera	Mar 13, 2023	Privacy PreservingQ-Learning	CodeCode Available
Deep Reinforcement Learning Algorithms for Option Hedging	Apr 7, 2025	Deep Reinforcement LearningQ-Learning	CodeCode Available
Deep Recurrent Q-Learning vs Deep Q-Learning on a simple Partially Observable Markov Decision Process with Minecraft	Mar 11, 2019	MinecraftQ-Learning	CodeCode Available
Temporal-Difference Learning Using Distributed Error Signals	Nov 6, 2024	Q-Learning	CodeCode Available
A Self-Adaptive Proposal Model for Temporal Action Detection based on Reinforcement Learning	Jun 22, 2017	Action DetectionPosition	CodeCode Available
Q-learning for Quantile MDPs: A Decomposition, Performance, and Convergence Analysis	Oct 31, 2024	Q-Learning	CodeCode Available
Learning to Communicate with Deep Multi-Agent Reinforcement Learning	May 21, 2016	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Towards Few-shot Coordination: Revisiting Ad-hoc Teamplay Challenge In the Game of Hanabi	Aug 20, 2023	Game of HanabiMulti-agent Reinforcement Learning	CodeCode Available
A Comparison of Reward Functions in Q-Learning Applied to a Cart Position Problem	May 25, 2021	PositionQ-Learning	CodeCode Available
SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference	Oct 15, 2019	Q-LearningReinforcement Learning	CodeCode Available
Towards Model-based Reinforcement Learning for Industry-near Environments	Jul 27, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
A Deep Q-Learning Agent for the L-Game with Variable Batch Training	Feb 17, 2018	Q-LearningSelf-Learning	CodeCode Available
A Deep Learning Approach to Grasping the Invisible	Sep 11, 2019	Deep LearningQ-Learning	CodeCode Available

Show:10 25 50

← PrevPage 33 of 39Next →

No leaderboard results yet.