SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–875 of 1918 papers

Title	Date	Tasks	Status
Hyperparameter Optimization for Tracking With Continuous Deep Q-Learning	Jun 1, 2018	Hyperparameter OptimizationObject Tracking	—Unverified
HyperQ-Opt: Q-learning for Hyperparameter Optimization	Dec 23, 2024	Bayesian OptimizationHyperparameter Optimization	—Unverified
Cell Switching in HAPS-Aided Networking: How the Obscurity of Traffic Loads Affects the Decision	May 1, 2024	Q-Learning	—Unverified
Energy Minimization in UAV-Aided Networks: Actor-Critic Learning for Constrained Scheduling Optimization	Jun 24, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Energy-Efficient Power Allocation and Q-Learning-Based Relay Selection for Relay-Aided D2D Communication	Apr 20, 2020	Q-Learning	—Unverified
A new convergent variant of Q-learning with linear function approximation	Dec 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Imagination-Limited Q-Learning for Offline Reinforcement Learning	May 18, 2025	D4RLQ-Learning	—Unverified
Imitating Language via Scalable Inverse Reinforcement Learning	Sep 2, 2024	DiversityImitation Learning	—Unverified
Implementing Inductive bias for different navigation tasks through diverse RNN attrractors	May 1, 2020	Inductive BiasQ-Learning	—Unverified
Energy Consumption and Battery Aging Minimization Using a Q-learning Strategy for a Battery/Ultracapacitor Electric Vehicle	Oct 27, 2020	energy managementManagement	—Unverified
Implicit Constraint-Aware Off-Policy Correction for Offline Reinforcement Learning	Jun 16, 2025	Q-Learning	—Unverified
Improved Q-learning based Multi-hop Routing for UAV-Assisted Communication	Aug 17, 2024	Collision AvoidanceQ-Learning	—Unverified
Causal Mean Field Multi-Agent Reinforcement Learning	Feb 20, 2025	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Improve Value Estimation of Q Function and Reshape Reward with Monte Carlo Tree Search	Oct 15, 2024	Q-Learning	—Unverified
Energy-aware optimization of UAV base stations placement via decentralized multi-agent Q-learning	Jun 1, 2021	Decision MakingQ-Learning	—Unverified
Improving Performance of Spike-based Deep Q-Learning using Ternary Neurons	Jun 3, 2025	Atari GamesDecision Making	—Unverified
Energy and Service-priority aware Trajectory Design for UAV-BSs using Double Q-Learning	Oct 26, 2020	Q-Learning	—Unverified
Improving Search through A3C Reinforcement Learning based Conversational Agent	Sep 17, 2017	Q-Learningreinforcement-learning	—Unverified
Causal Deep Reinforcement Learning Using Observational Data	Nov 28, 2022	Autonomous DrivingCausal Inference	—Unverified
I'm sorry Dave, I'm afraid I can't do that, Deep Q-learning from forbidden action	Oct 4, 2019	Industrial RobotsQ-Learning	—Unverified
A New Approach for Tactical Decision Making in Lane Changing: Sample Efficient Deep Q Learning with a Safety Feedback Reward	Sep 24, 2020	Decision MakingQ-Learning	—Unverified
A Deep Reinforcement Learning Approach to Battery Management in Dairy Farming via Proximal Policy Optimization	Jul 1, 2024	Deep Reinforcement Learningenergy management	—Unverified
Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning	Mar 18, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
EnCoMP: Enhanced Covert Maneuver Planning with Adaptive Threat-Aware Visibility Estimation using Offline Reinforcement Learning	Mar 29, 2024	NavigateQ-Learning	—Unverified
Encoders and Decoders for Quantum Expander Codes Using Machine Learning	Sep 6, 2019	BIG-bench Machine LearningDecoder	—Unverified

Show:10 25 50

← PrevPage 35 of 77Next →

No leaderboard results yet.