Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1918 papers

Title	Date	Tasks	Status
Generative Multi-Agent Q-Learning for Policy Optimization: Decentralized Wireless Networks	Mar 7, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Genetic Algorithm enhanced by Deep Reinforcement Learning in parent selection mechanism and mutation : Minimizing makespan in permutation flow shop scheduling problems	Nov 10, 2023	Deep Reinforcement LearningDiversity	—Unverified
Control-Tutored Reinforcement Learning: Towards the Integration of Data-Driven and Model-Based Control	Dec 11, 2021	OpenAI GymQ-Learning	—Unverified
GINO-Q: Learning an Asymptotically Optimal Index Policy for Restless Multi-armed Bandits	Aug 19, 2024	Multi-Armed BanditsQ-Learning	—Unverified
G-Learner and GIRL: Goal Based Wealth Management with Reinforcement Learning	Feb 25, 2020	ManagementQ-Learning	—Unverified
Control-Tutored Reinforcement Learning: an application to the Herding Problem	Nov 26, 2019	Q-Learningreinforcement-learning	—Unverified
Deep Spectral Q-learning with Application to Mobile Health	Jan 3, 2023	Q-Learning	—Unverified
Approximate Global Convergence of Independent Learning in Multi-Agent Systems	May 30, 2024	Q-Learning	—Unverified
Gradient Q(σ, λ): A Unified Algorithm with Function Approximation for Reinforcement Learning	Sep 6, 2019	Q-LearningReinforcement Learning	—Unverified
Deep SIMBAD: Active Landmark-based Self-localization Using Ranking -based Scene Descriptor	Sep 6, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
GraMeR: Graph Meta Reinforcement Learning for Multi-Objective Influence Maximization	May 30, 2022	Computational EfficiencyMarketing	—Unverified
Convergence of Batch Asynchronous Stochastic Approximation With Applications to Reinforcement Learning	Sep 8, 2021	Q-Learningreinforcement-learning	—Unverified
Graph-based Reinforcement Learning meets Mixed Integer Programs: An application to 3D robot assembly discovery	Mar 8, 2022	global-optimizationMotion Planning	—Unverified
Graph Exploration for Effective Multi-agent Q-Learning	Apr 19, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Graph Neural Network based Agent in Google Research Football	Apr 23, 2022	Graph Neural NetworkQ-Learning	—Unverified
Graph Q-Learning for Combinatorial Optimization	Jan 11, 2024	Combinatorial OptimizationDecision Making	—Unverified
Greedy-Step Off-Policy Reinforcement Learning	Feb 23, 2021	Q-Learningreinforcement-learning	—Unverified
Greedy UnMixing for Q-Learning in Multi-Agent Reinforcement Learning	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Convergent and Efficient Deep Q Learning Algorithm	Sep 29, 2021	Q-Learningreinforcement-learning	—Unverified
Approximate Nash Equilibrium Learning for n-Player Markov Games in Dynamic Pricing	Jul 13, 2022	Q-Learning	—Unverified
Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution	Apr 5, 2024	continuous-controlContinuous Control	—Unverified
Guiding Reinforcement Learning Exploration Using Natural Language	Jul 26, 2017	DecoderMachine Translation	—Unverified
On Using Hamiltonian Monte Carlo Sampling for Reinforcement Learning Problems in High-dimension	Nov 11, 2020	Matrix CompletionQ-Learning	—Unverified
Hamilton-Jacobi-Bellman Equations for Q-Learning in Continuous Time	Dec 23, 2019	Q-Learningreinforcement-learning	—Unverified
A Lifetime Extended Energy Management Strategy for Fuel Cell Hybrid Electric Vehicles via Self-Learning Fuzzy Reinforcement Learning	Feb 13, 2023	energy managementManagement	—Unverified
Convert Language Model into a Value-based Strategic Planner	May 11, 2025	Language ModelingLanguage Modelling	—Unverified
Harnessing Deep Q-Learning for Enhanced Statistical Arbitrage in High-Frequency Trading: A Comprehensive Exploration	Sep 13, 2023	Decision MakingQ-Learning	—Unverified
Deep Robot Sketching: An application of Deep Q-Learning Networks for human-like sketching	Feb 1, 2024	Q-Learningreinforcement-learning	—Unverified
HAVER: Instance-Dependent Error Bounds for Maximum Mean Estimation and Applications to Q-Learning and Monte Carlo Tree Search	Nov 1, 2024	Q-Learning	—Unverified
Hedging of Financial Derivative Contracts via Monte Carlo Tree Search	Feb 11, 2021	Q-Learningreinforcement-learning	—Unverified
Hedging using reinforcement learning: Contextual k-Armed Bandit versus Q-learning	Jul 3, 2020	FrictionQ-Learning	—Unverified
Cooperation and Reputation Dynamics with Reinforcement Learning	Feb 15, 2021	Q-Learningreinforcement-learning	—Unverified
Hidden Incentives for Auto-Induced Distributional Shift	Sep 19, 2020	BIG-bench Machine LearningMeta-Learning	—Unverified
Hidden Markov Model Estimation-Based Q-learning for Partially Observable Markov Decision Process	Sep 17, 2018	Q-Learning	—Unverified
Hierarchical clustering with deep Q-learning	May 28, 2018	ClusteringQ-Learning	—Unverified
Cooperative Control of Mobile Robots with Stackelberg Learning	Aug 3, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Hierarchical Deep Q-Learning Based Handover in Wireless Networks with Dual Connectivity	Jan 13, 2023	Q-Learningreinforcement-learning	—Unverified
Hierarchical Modular Reinforcement Learning Method and Knowledge Acquisition of State-Action Rule for Multi-target Problem	Apr 8, 2018	PositionQ-Learning	—Unverified
Cooperative Optimal Output Tracking for Discrete-Time Multiagent Systems: Stabilizing Policy Iteration Frameworks and Analysis	Jan 11, 2025	Q-Learning	—Unverified
High dimensional precision medicine from patient-derived xenografts	Dec 13, 2019	Q-LearningVocal Bursts Intensity Prediction	—Unverified
High-Dimensional Stock Portfolio Trading with Deep Reinforcement Learning	Dec 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Highway Reinforcement Learning	May 28, 2024	Q-Learningreinforcement-learning	—Unverified
Hippocampal representations emerge when training recurrent neural networks on a memory dependent maze navigation task	Dec 2, 2020	HippocampusQ-Learning	—Unverified
How to discretize continuous state-action spaces in Q-learning: A symbolic control approach	Jun 3, 2024	Q-Learning	—Unverified
Human and Multi-Agent collaboration in a human-MARL teaming framework	Jun 12, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Hybridizing the 1/5-th Success Rule with Q-Learning for Controlling the Mutation Rate of an Evolutionary Algorithm	Jun 19, 2020	Evolutionary AlgorithmsQ-Learning	—Unverified
Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving	Oct 11, 2024	Autonomous DrivingDecision Making	—Unverified
Hybrid Policies Using Inverse Rewards for Reinforcement Learning	Sep 27, 2018	OpenAI GymQ-Learning	—Unverified
Hybrid Q-Learning Applied to Ubiquitous recommender system	Mar 10, 2013	Q-LearningRecommendation Systems	—Unverified
A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts	Aug 15, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified

Show:10 25 50

← PrevPage 17 of 39Next →

No leaderboard results yet.