Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 1918 papers

Title	Date	Tasks	Status
CAN ALTQ LEARN FASTER: EXPERIMENTS AND THEORY	Sep 25, 2019	Atari GamesQ-Learning	—Unverified
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified
An efficient data-based off-policy Q-learning algorithm for optimal output feedback control of linear systems	Dec 6, 2023	Q-Learning	—Unverified
Collaborative Deep Reinforcement Learning for Joint Object Search	Feb 18, 2017	Active Object LocalizationDeep Reinforcement Learning	—Unverified
A Differentiable Physics Engine for Deep Learning in Robotics	Nov 5, 2016	CPUDeep Learning	—Unverified
Combating Reinforcement Learning's Sisyphean Curse with Intrinsic Fear	Nov 3, 2016	Atari GamesDeep Reinforcement Learning	—Unverified
An MDP Model for Censoring in Harvesting Sensors: Optimal and Approximated Solutions	Feb 2, 2025	Q-Learning	—Unverified
Cross Learning in Deep Q-Networks	Sep 29, 2020	Q-Learningreinforcement-learning	—Unverified
Combining policy gradient and Q-learning	Nov 5, 2016	Atari GamesQ-Learning	—Unverified
Combining Q-Learning and Search with Amortized Value Estimates	Dec 5, 2019	Q-Learning	—Unverified
Caching Placement and Resource Allocation for Cache-Enabling UAV NOMA Networks	Aug 12, 2020	Q-LearningScheduling	—Unverified
Comparative Analysis of Multi-Agent Reinforcement Learning Policies for Crop Planning Decision Support	Dec 3, 2024	Computational EfficiencyFairness	—Unverified
Comparative Study of Q-Learning and NeuroEvolution of Augmenting Topologies for Self Driving Agents	Sep 19, 2022	Autonomous DrivingEvolutionary Algorithms	—Unverified
Comparing NARS and Reinforcement Learning: An Analysis of ONA and Q-Learning Algorithms	Mar 17, 2023	Q-Learningreinforcement-learning	—Unverified
Cache-Aided NOMA Mobile Edge Computing: A Reinforcement Learning Approach	Jun 20, 2019	Edge-computingQ-Learning	—Unverified
Compositional Reinforcement Learning for Discrete-Time Stochastic Control Systems	Aug 6, 2022	Q-Learningreinforcement-learning	—Unverified
An Optimization Method-Assisted Ensemble Deep Reinforcement Learning Algorithm to Solve Unit Commitment Problems	Jun 9, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
A Double Q-Learning Approach for Navigation of Aerial Vehicles with Connectivity Constraint	Feb 24, 2020	Q-LearningReinforcement Learning	—Unverified
Compressive Features in Offline Reinforcement Learning for Recommender Systems	Nov 16, 2021	Q-LearningRecommendation Systems	—Unverified
A Note on Target Q-learning For Solving Finite MDPs with A Generative Oracle	Mar 22, 2022	Q-Learning	—Unverified
Computation Offloading for Uncertain Marine Tasks by Cooperation of UAVs and Vessels	Feb 13, 2023	Q-Learning	—Unverified
Computing and Learning Stationary Mean Field Equilibria with Scalar Interactions: Algorithms and Applications	Feb 2, 2025	counterfactualPolicy Gradient Methods	—Unverified
Concentration bounds for SSP Q-learning for average cost MDPs	Jun 7, 2022	Q-Learning	—Unverified
Concentration of Contractive Stochastic Approximation and Reinforcement Learning	Jun 27, 2021	Q-Learningreinforcement-learning	—Unverified
Concentration of Contractive Stochastic Approximation: Additive and Multiplicative Noise	Mar 28, 2023	Q-Learning	—Unverified
Concept and the implementation of a tool to convert industry 4.0 environments modeled as FSM to an OpenAI Gym wrapper	Jun 29, 2020	OpenAI GymQ-Learning	—Unverified
Configuring Transmission Thresholds in IIoT Alarm Scenarios for Energy-Efficient Event Reporting	Jul 4, 2024	Q-LearningScheduling	—Unverified
A Novel Resource Allocation for Anti-jamming in Cognitive-UAVs: an Active Inference Approach	Aug 10, 2022	Bayesian InferenceQ-Learning	—Unverified
An Efficient and Uncertainty-aware Reinforcement Learning Framework for Quality Assurance in Extrusion Additive Manufacturing	Mar 2, 2025	Q-LearningUncertainty Quantification	—Unverified
Consecutive Task-oriented Dialog Policy Learning	Nov 16, 2021	Continual LearningManagement	—Unverified
An Overview of Machine Learning-Enabled Optimization for Reconfigurable Intelligent Surfaces-Aided 6G Networks: From Reinforcement Learning to Large Language Models	May 9, 2024	Hierarchical Reinforcement LearningManagement	—Unverified
Bridging the Performance Gap Between Target-Free and Target-Based Reinforcement Learning With Iterated Q-Learning	Jun 4, 2025	Q-Learning	—Unverified
CoNSoLe: Convex Neural Symbolic Learning	Jun 1, 2022	Q-Learning	—Unverified
Constant Stepsize Q-learning: Distributional Convergence, Bias and Extrapolation	Jan 25, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Constrained Model-Free Reinforcement Learning for Process Optimization	Nov 16, 2020	modelModel Predictive Control	—Unverified
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning	Jul 19, 2021	Offline RLQ-Learning	—Unverified
Constructing narrative using a generative model and continuous action policies	Sep 1, 2017	Paraphrase IdentificationQ-Learning	—Unverified
Contextual Conservative Q-Learning for Offline Reinforcement Learning	Jan 3, 2023	MuJoCoQ-Learning	—Unverified
A Penalized Shared-parameter Algorithm for Estimating Optimal Dynamic Treatment Regimens	Jul 13, 2021	Q-Learning	—Unverified
Contextual Policy Transfer in Reinforcement Learning Domains via Deep Mixtures-of-Experts	Feb 29, 2020	Mixture-of-ExpertsOpenAI Gym	—Unverified
Bridging the Gap Between Value and Policy Based Reinforcement Learning	Feb 28, 2017	Q-Learningreinforcement-learning	—Unverified
APF+: Boosting adaptive-potential function reinforcement learning methods with a W-shaped network for high-dimensional games	Mar 17, 2025	Atari GamesQ-Learning	—Unverified
Continuous Deep Q-Learning in Optimal Control Problems: Normalized Advantage Functions Analysis	Sep 29, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
A Nearly Optimal and Low-Switching Algorithm for Reinforcement Learning with General Function Approximation	Nov 26, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Application of Deep Q-Network in Portfolio Management	Mar 13, 2020	Deep Reinforcement LearningFace Recognition	—Unverified
Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy	Jul 4, 2024	Q-Learning	—Unverified
Continuous-time q-learning for mean-field control problems	Jun 28, 2023	Q-Learning	—Unverified
Continuous-time Risk-sensitive Reinforcement Learning via Quadratic Variation Penalty	Apr 19, 2024	Q-Learningreinforcement-learning	—Unverified
Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement Learning	Oct 9, 2021	Q-Learningreinforcement-learning	—Unverified
Breaking the Deadly Triad with a Target Network	Jan 21, 2021	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 8 of 39Next →

No leaderboard results yet.