Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1918 papers

Title	Date	Tasks	Status
Evaluating Load Models and Their Impacts on Power Transfer Limits	Aug 7, 2020	Q-Learning	—Unverified
Evaluating Reinforcement Learning Algorithms for Navigation in Simulated Robotic Quadrupeds: A Comparative Study Inspired by Guide Dog Behaviour	Jul 17, 2025	Autonomous NavigationQ-Learning	—Unverified
Evaluation of Reinforcement Learning Techniques for Trading on a Diverse Portfolio	Jun 28, 2023	Q-Learningreinforcement-learning	—Unverified
Evaluation of Reinforcement Learning for Autonomous Penetration Testing using A3C, Q-learning and DQN	Jul 22, 2024	Decision MakingQ-Learning	—Unverified
Evolution of cooperation in the public goods game with Q-learning	Jul 29, 2024	Decision MakingImitation Learning	—Unverified
Evolution of Q Values for Deep Q Learning in Stable Baselines	Apr 24, 2020	Q-LearningReinforcement Learning	—Unverified
Exclusively Penalized Q-learning for Offline Reinforcement Learning	May 23, 2024	Offline RLQ-Learning	—Unverified
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Experimental Analysis of Reinforcement Learning Techniques for Spectrum Sharing Radar	Jan 6, 2020	Q-Learningreinforcement-learning	—Unverified
Expert Q-learning: Deep Reinforcement Learning with Coarse State Values from Offline Expert Examples	Jun 28, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Exploiting Estimation Bias in Clipped Double Q-Learning for Continous Control Reinforcement Learning Tasks	Feb 14, 2024	Computational Efficiencycontinuous-control	—Unverified
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Exploration, Exploitation, and Engagement in Multi-Armed Bandits with Abandonment	May 26, 2022	Multi-Armed BanditsQ-Learning	—Unverified
Exploration-Exploitation in Multi-Agent Competition: Convergence with Bounded Rationality	Jun 24, 2021	Q-Learning	—Unverified
Exploration in Knowledge Transfer Utilizing Reinforcement Learning	Jul 15, 2024	Q-Learningreinforcement-learning	—Unverified
Exploration via Epistemic Value Estimation	Mar 7, 2023	Decision MakingEfficient Exploration	—Unverified
Exploration with Unreliable Intrinsic Reward in Multi-Agent Reinforcement Learning	Jun 5, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Exploratory Control with Tsallis Entropy for Latent Factor Models	Nov 14, 2022	Q-Learning	—Unverified
Exploring Competitive and Collusive Behaviors in Algorithmic Pricing with Deep Reinforcement Learning	Mar 14, 2025	Deep Reinforcement LearningQ-Learning	—Unverified
Extrinsicaly Rewarded Soft Q Imitation Learning with Discriminator	Jan 30, 2024	Imitation LearningMuJoCo	—Unverified
Fair Loss: Margin-Aware Reinforcement Learning for Deep Face Recognition	Oct 1, 2019	Face RecognitionQ-Learning	—Unverified
Fast Adaptive Anti-Jamming Channel Access via Deep Q Learning and Coarse-Grained Spectrum Prediction	Feb 7, 2025	Deep Reinforcement LearningQ-Learning	—Unverified
Fast Block Linear System Solver Using Q-Learning Schduling for Unified Dynamic Power System Simulations	Oct 12, 2021	Q-LearningScheduling	—Unverified
Fast constraint satisfaction problem and learning-based algorithm for solving Minesweeper	May 10, 2021	Decision MakingQ-Learning	—Unverified
GLSearch: Maximum Common Subgraph Detection via Learning to Search	Feb 8, 2020	Cloud ComputingGraph Embedding	—Unverified
Faster Deep Q-learning using Neural Episodic Control	Jan 6, 2018	Deep Reinforcement LearningQ-Learning	—Unverified
Faster Non-asymptotic Convergence for Double Q-learning	Dec 1, 2021	Q-Learning	—Unverified
Faster Q-Learning Algorithms for Restless Bandits	Sep 6, 2024	Multi-Armed BanditsQ-Learning	—Unverified
Fastest Convergence for Q-learning	Jul 12, 2017	Q-Learningreinforcement-learning	—Unverified
Fast-Fading Channel and Power Optimization of the Magnetic Inductive Cellular Network	Jun 7, 2024	Q-Learning	—Unverified
Federated Deep Q-Learning and 5G load balancing	Feb 10, 2024	Q-Learning	—Unverified
Federated Double Deep Q-learning for Joint Delay and Energy Minimization in IoT networks	Apr 2, 2021	Deep Reinforcement LearningFederated Learning	—Unverified
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices	Feb 8, 2024	Federated LearningOffline RL	—Unverified
Federated Q-Learning: Linear Regret Speedup with Low Communication Cost	Dec 22, 2023	Q-Learningreinforcement-learning	—Unverified
Federated Q-Learning with Reference-Advantage Decomposition: Almost Optimal Regret and Logarithmic Communication Cost	May 29, 2024	Q-Learning	—Unverified
Federated Stochastic Approximation under Markov Noise and Heterogeneity: Applications in Reinforcement Learning	Jun 21, 2022	Q-Learningreinforcement-learning	—Unverified
FedHQL: Federated Heterogeneous Q-Learning	Jan 26, 2023	Q-Learningreinforcement-learning	—Unverified
Few is More: Task-Efficient Skill-Discovery for Multi-Task Offline Multi-Agent Reinforcement Learning	Feb 13, 2025	Learning to ExecuteMulti-agent Reinforcement Learning	—Unverified
Fictitious play in zero-sum stochastic games	Oct 8, 2020	Q-Learning	—Unverified
Fidelity-based Probabilistic Q-learning for Control of Quantum Systems	Jun 8, 2018	Q-LearningReinforcement Learning	—Unverified
Final Adaptation Reinforcement Learning for N-Player Games	Nov 29, 2021	Board GamesQ-Learning	—Unverified
Finding the best design parameters for optical nanostructures using reinforcement learning	Oct 18, 2018	BIG-bench Machine LearningQ-Learning	—Unverified
Finite Horizon Q-learning: Stability, Convergence, Simulations and an application on Smart Grids	Oct 27, 2021	Q-Learningreinforcement-learning	—Unverified
Finite-Sample Analysis for SARSA with Linear Function Approximation	Feb 6, 2019	Q-LearningReinforcement Learning	—Unverified
Finite Sample Analysis of Average-Reward TD Learning and Q-Learning	Dec 1, 2021	Q-Learning	—Unverified
Finite-Sample Analysis of Decentralized Q-Learning for Stochastic Games	Dec 15, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Finite-Sample Analysis of Stochastic Approximation Using Smooth Convex Envelopes	Feb 3, 2020	Q-LearningReinforcement Learning	—Unverified
Finite-sample Guarantees for Nash Q-learning with Linear Function Approximation	Mar 1, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Finite-Time Analysis for Double Q-learning	Sep 29, 2020	Q-Learning	—Unverified
Finite-Time Analysis of Asynchronous Stochastic Approximation and Q-Learning	Feb 1, 2020	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 21 of 39Next →

No leaderboard results yet.