Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1600 of 1918 papers

Title	Date	Tasks	Status
Recurrent Neural Network-based Anti-jamming Framework for Defense Against Multiple Jamming Policies	Aug 19, 2022	Q-Learning	—Unverified
Recursive Backwards Q-Learning in Deterministic Environments	Apr 24, 2024	Q-Learning	—Unverified
Recursive Reinforcement Learning	Jun 23, 2022	IngenuityQ-Learning	—Unverified
Preventing Value Function Collapse in Ensemble Q-Learning by Maximizing Representation Diversity	Jun 24, 2020	DiversityQ-Learning	—Unverified
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage	Feb 5, 2023	Offline RLQ-Learning	—Unverified
Regret Bounds for Discounted MDPs	Feb 12, 2020	Q-LearningReinforcement Learning	—Unverified
Toward Packet Routing with Fully-distributed Multi-agent Deep Reinforcement Learning	May 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning	Jun 5, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Regularize! Don't Mix: Multi-Agent Reinforcement Learning without Explicit Centralized Structures	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Regularized Q-learning	Feb 11, 2022	Q-Learningreinforcement-learning	—Unverified
Regularized Q-Learning with Linear Function Approximation	Jan 26, 2024	Decision Making Under UncertaintyQ-Learning	—Unverified
Regularly Updated Deterministic Policy Gradient Algorithm	Jul 1, 2020	MuJoCoQ-Learning	—Unverified
ReinDSplit: Reinforced Dynamic Split Learning for Pest Recognition in Precision Agriculture	Jun 16, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Reinforced Co-Training	Apr 17, 2018	Clickbait DetectionGeneral Classification	—Unverified
Reinforced Deep Markov Models With Applications in Automatic Trading	Nov 9, 2020	Q-Learning	—Unverified
Reinforced Hybrid Genetic Algorithm for the Traveling Salesman Problem	Jul 9, 2021	DiversityQ-Learning	—Unverified
Reinforced Pedestrian Attribute Recognition with Group Optimization Reward	May 21, 2022	AttributeDecision Making	—Unverified
Reinforcement Causal Structure Learning on Order Graph	Nov 22, 2022	Causal DiscoveryQ-Learning	—Unverified
Reinforcement Evolutionary Learning Method for self-learning	Oct 7, 2018	Incremental LearningMarketing	—Unverified
Reinforcement learning adaptive fuzzy controller for lighting systems: application to aircraft cabin	Sep 30, 2023	ManagementQ-Learning	—Unverified
Reinforcement Learning Approach for Multi-Agent Flexible Scheduling Problems	Oct 7, 2022	Combinatorial OptimizationDecision Making	—Unverified
Reinforcement Learning approach for Real Time Strategy Games Battle city and S3	Feb 16, 2016	Q-LearningReal-Time Strategy Games	—Unverified
Reinforcement learning approach for resource allocation in humanitarian logistics	Feb 25, 2021	HumanitarianQ-Learning	—Unverified
Reinforcement Learning Assisted Beamforming for Inter-cell Interference Mitigation in 5G Massive MIMO Networks	Jan 27, 2021	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Based Algorithm for the Maximization of EV Charging Station Revenue	Jul 4, 2014	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor	Jun 6, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning Based Cooperative Coded Caching under Dynamic Popularities in Ultra-Dense Networks	Mar 8, 2020	Q-LearningReinforcement Learning	—Unverified
Reinforcement Learning-Based Cooperative P2P Power Trading between DC Nanogrid Clusters with Wind and PV Energy Resources	Sep 16, 2022	energy tradingManagement	—Unverified
Reinforcement Learning based Dynamic Model Selection for Short-Term Load Forecasting	Nov 5, 2018	BIG-bench Machine LearningLoad Forecasting	—Unverified
Reinforcement Learning Based Handwritten Digit Recognition with Two-State Q-Learning	Jun 28, 2020	BenchmarkingHandwritten Digit Recognition	—Unverified
Reinforcement Learning-based Joint Path and Energy Optimization of Cellular-Connected Unmanned Aerial Vehicles	Nov 27, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning-Based Joint Self-Optimisation Method for the Fuzzy Logic Handover Algorithm in 5G HetNets	Jun 9, 2020	ClusteringManagement	—Unverified
Reinforcement learning based local path planning for mobile robot	Oct 24, 2023	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Based Minimum State-flipped Control for the Reachability of Boolean Control Networks	Apr 11, 2023	Q-LearningTransfer Learning	—Unverified
Reinforcement Learning based on Scenario-tree MPC for ASVs	Mar 22, 2021	Model Predictive ControlPoint Tracking	—Unverified
Reinforcement Learning based Per-antenna Discrete Power Control for Massive MIMO Systems	Jan 28, 2021	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning-Based Policy Optimisation For Heterogeneous Radio Access	Jun 18, 2025	Q-Learningreinforcement-learning	—Unverified
Reinforcement learning based recommender systems: A survey	Jan 15, 2021	Collaborative FilteringDeep Reinforcement Learning	—Unverified
Reinforcement Learning-Based Trajectory Design for the Aerial Base Stations	Jun 23, 2019	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning-Enabled Decision-Making Strategies for a Vehicle-Cyber-Physical-System in Connected Environment	Jul 16, 2020	Autonomous VehiclesDecision Making	—Unverified
Reinforcement Learning-enabled Satellite Constellation Reconfiguration and Retasking for Mission-Critical Applications	Sep 3, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Adaptive Caching with Dynamic Storage Pricing	Dec 17, 2018	Decision MakingQ-Learning	—Unverified
Reinforcement Learning for Adaptive Resource Scheduling in Complex System Environments	Nov 8, 2024	Cloud ComputingEdge-computing	—Unverified
Reinforcement Learning for Assignment problem	Nov 8, 2020	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Battery Management in Dairy Farming	Aug 17, 2023	ManagementQ-Learning	—Unverified
Reinforcement Learning for Dynamic Resource Optimization in 5G Radio Access Network Slicing	Sep 14, 2020	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Finite Space Mean-Field Type Games	Sep 25, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning for Hanabi	May 31, 2025	Card GamesDeep Reinforcement Learning	—Unverified
Reinforcement Learning for Joint V2I Network Selection and Autonomous Driving Policies	Aug 3, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified
Reinforcement Learning for Jump-Diffusions, with Financial Applications	May 26, 2024	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 32 of 39Next →

No leaderboard results yet.