Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1918 papers

Title	Date	Tasks	Status
Dynamic Decision Making in Engineering System Design: A Deep Q-Learning Approach	Dec 28, 2023	Decision MakingQ-Learning	—Unverified
Dynamic operator management in meta-heuristics using reinforcement learning: an application to permutation flowshop scheduling problems	Aug 27, 2024	ManagementQ-Learning	—Unverified
Dynamic Optimization of Storage Systems Using Reinforcement Learning Techniques	Dec 29, 2024	CPUQ-Learning	—Unverified
Dynamic Retail Pricing via Q-Learning -- A Reinforcement Learning Framework for Enhanced Revenue Management	Nov 27, 2024	Decision MakingManagement	—Unverified
Dynamic value alignment through preference aggregation of multiple objectives	Oct 9, 2023	Q-Learning	—Unverified
Easy as ABCs: Unifying Boltzmann Q-Learning and Counterfactual Regret Minimization	Feb 19, 2024	counterfactualOpenAI Gym	—Unverified
Attention-Enhanced Prioritized Proximal Policy Optimization for Adaptive Edge Caching	Feb 8, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
Edge Delayed Deep Deterministic Policy Gradient: efficient continuous control for edge scenarios	Dec 9, 2024	continuous-controlContinuous Control	—Unverified
EduQate: Generating Adaptive Curricula through RMABs in Education Settings	Jun 20, 2024	Multi-Armed BanditsQ-Learning	—Unverified
EEG-based Drowsiness Estimation for Driving Safety using Deep Q-Learning	Jan 8, 2020	Brain Computer InterfaceDeep Reinforcement Learning	—Unverified
Efficient and practical quantum compiler towards multi-qubit systems with deep reinforcement learning	Apr 14, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Event-Based Communication in Distributed Q-Learning	Sep 3, 2021	Q-Learning	—Unverified
Efficient Drone Mobility Support Using Reinforcement Learning	Nov 21, 2019	Q-Learningreinforcement-learning	—Unverified
Efficient LSTM Training with Eligibility Traces	Sep 30, 2022	Q-LearningReinforcement Learning (RL)	—Unverified
Efficient Off-Policy Q-Learning for Data-Based Discrete-Time LQR Problems	May 17, 2021	Q-Learning	—Unverified
Efficient Open-world Reinforcement Learning via Knowledge Distillation and Autonomous Rule Discovery	Nov 24, 2023	Deep Reinforcement LearningKnowledge Distillation	—Unverified
Logit-Q Dynamics for Efficient Learning in Stochastic Teams	Feb 20, 2023	Q-Learning	—Unverified
Extracting Heuristics from Large Language Models for Reward Shaping in Reinforcement Learning	May 24, 2024	Language ModellingLarge Language Model	—Unverified
Efficient Triangular Arbitrage Detection via Graph Neural Networks	Feb 5, 2025	Q-Learning	—Unverified
Elastic Decision Transformer	Jul 5, 2023	Atari GamesD4RL	—Unverified
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL	Jul 21, 2020	D4RLDecision Making	—Unverified
Emergence of Addictive Behaviors in Reinforcement Learning Agents	Nov 14, 2018	Q-Learningreinforcement-learning	—Unverified
Emergence of cooperation under punishment: A reinforcement learning perspective	Jan 29, 2024	Imitation LearningQ-Learning	—Unverified
Empirical evaluation of a Q-Learning Algorithm for Model-free Autonomous Soaring	Jul 18, 2017	Q-LearningReinforcement Learning	—Unverified
Empirically Evaluating Multiagent Learning Algorithms	Jan 31, 2014	Q-Learning	—Unverified
Empirical Q-Value Iteration	Nov 30, 2014	Q-Learning	—Unverified
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL	Apr 15, 2024	GPUOffline RL	—Unverified
Encoders and Decoders for Quantum Expander Codes Using Machine Learning	Sep 6, 2019	BIG-bench Machine LearningDecoder	—Unverified
EnCoMP: Enhanced Covert Maneuver Planning with Adaptive Threat-Aware Visibility Estimation using Offline Reinforcement Learning	Mar 29, 2024	NavigateQ-Learning	—Unverified
Energy and Service-priority aware Trajectory Design for UAV-BSs using Double Q-Learning	Oct 26, 2020	Q-Learning	—Unverified
Energy-aware optimization of UAV base stations placement via decentralized multi-agent Q-learning	Jun 1, 2021	Decision MakingQ-Learning	—Unverified
Energy Consumption and Battery Aging Minimization Using a Q-learning Strategy for a Battery/Ultracapacitor Electric Vehicle	Oct 27, 2020	energy managementManagement	—Unverified
Energy-Efficient Power Allocation and Q-Learning-Based Relay Selection for Relay-Aided D2D Communication	Apr 20, 2020	Q-Learning	—Unverified
Energy Minimization in UAV-Aided Networks: Actor-Critic Learning for Constrained Scheduling Optimization	Jun 24, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Energy Sharing for Multiple Sensor Nodes with Finite Buffers	Mar 17, 2015	Q-Learning	—Unverified
Enhanced Deep Q-Learning for 2D Self-Driving Cars: Implementation and Evaluation on a Custom Track Environment	Feb 13, 2024	Q-LearningSelf-Driving Cars	—Unverified
Enhanced Q-Learning Approach to Finite-Time Reachability with Maximum Probability for Probabilistic Boolean Control Networks	Dec 12, 2023	Q-LearningTransfer Learning	—Unverified
Enhanced Rolling Horizon Evolution Algorithm with Opponent Model Learning: Results for the Fighting Game AI Competition	Mar 31, 2020	Q-LearningReinforcement Learning	—Unverified
Enhancement of High-definition Map Update Service Through Coverage-aware and Reinforcement Learning	Feb 8, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
Enhancing Classification Performance via Reinforcement Learning for Feature Selection	Mar 9, 2024	Classificationfeature selection	—Unverified
Enhancing Q-Learning with Large Language Model Heuristics	May 6, 2024	Decision MakingLanguage Modeling	—Unverified
Enhancing reinforcement learning by a finite reward response filter with a case study in intelligent structural control	Oct 25, 2020	Q-Learningreinforcement-learning	—Unverified
Ensemble Bootstrapping for Q-Learning	Feb 28, 2021	Atari GamesQ-Learning	—Unverified
Entropic Risk Optimization in Discounted MDPs: Sample Complexity Bounds with a Generative Model	May 30, 2025	Q-Learning	—Unverified
Entropy-Augmented Entropy-Regularized Reinforcement Learning and a Continuous Path from Policy Gradient to Q-Learning	May 18, 2020	Q-Learning	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
Episodic Exploration for Deep Deterministic Policies: An Application to StarCraft Micromanagement Tasks	Sep 10, 2016	Q-Learningreinforcement-learning	—Unverified
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
Equivariant Offline Reinforcement Learning	Jun 20, 2024	Offline RLQ-Learning	—Unverified
Escaping the State of Nature: A Hobbesian Approach to Cooperation in Multi-agent Reinforcement Learning	Jun 5, 2019	Multi-agent Reinforcement LearningPhilosophy	—Unverified

Show:10 25 50

← PrevPage 20 of 39Next →

No leaderboard results yet.