Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1918 papers

Title	Date	Tasks	Status
Projected Off-Policy Q-Learning (POP-QL) for Stabilizing Offline Reinforcement Learning	Nov 25, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Projection Implicit Q-Learning with Support Constraint for Offline Reinforcement Learning	Jan 15, 2025	D4RLQ-Learning	—Unverified
Projective simulation for classical learning agents: a comprehensive investigation	May 7, 2013	Q-LearningReinforcement Learning	—Unverified
Prospect-theoretic Q-learning	Apr 12, 2021	Q-Learning	—Unverified
Prospect Theory-inspired Automated P2P Energy Trading with Q-learning-based Dynamic Pricing	Aug 26, 2022	energy tradingQ-Learning	—Unverified
Protein Structure Prediction in the 3D HP Model Using Deep Reinforcement Learning	Dec 29, 2024	Deep Reinforcement LearningProtein Structure Prediction	—Unverified
Provable Multi-Objective Reinforcement Learning with Generative Models	Nov 19, 2020	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Provable Reinforcement Learning for Networked Control Systems with Stochastic Packet Disordering	Dec 5, 2023	Q-Learningreinforcement-learning	—Unverified
Gauss-Newton Temporal Difference Learning with Nonlinear Function Approximation	Feb 25, 2023	Offline RLQ-Learning	—Unverified
Provably Efficient Kernelized Q-Learning	Apr 21, 2022	Q-Learning	—Unverified
Provably Efficient Multi-Agent Reinforcement Learning with Fully Decentralized Communication	Oct 14, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle	Jun 14, 2019	Q-Learningreinforcement-learning	—Unverified
Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle	Dec 1, 2019	Q-Learningreinforcement-learning	—Unverified
Provably Efficient Q-Learning with Low Switching Cost	May 30, 2019	Q-Learning	—Unverified
Provably Efficient Reinforcement Learning with Aggregated States	Dec 13, 2019	Q-Learningreinforcement-learning	—Unverified
Provably Efficient Reinforcement Learning in Decentralized General-Sum Markov Games	Oct 12, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Provably More Efficient Q-Learning in the One-Sided-Feedback/Full-Feedback Settings	Jun 30, 2020	Q-Learning	—Unverified
Direct Data-Driven Discrete-time Bilinear Biquadratic Regulator	Aug 29, 2022	Q-Learning	—Unverified
Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care	Jun 13, 2023	Offline RLQ-Learning	—Unverified
Pseudorehearsal in value function approximation	Mar 21, 2017	Q-Learningreinforcement-learning	—Unverified
Learned Collusion	Apr 25, 2023	Q-Learning	—Unverified
Q-Cogni: An Integrated Causal Reinforcement Learning Framework	Feb 26, 2023	Causal InferenceDecision Making	—Unverified
Q-CP: Learning Action Values for Cooperative Planning	Mar 1, 2018	Model-based Reinforcement LearningQ-Learning	—Unverified
Q-DATA: Enhanced Traffic Flow Monitoring in Software-Defined Networks applying Q-learning	Sep 4, 2019	ManagementQ-Learning	—Unverified
QF-tuner: Breaking Tradition in Reinforcement Learning	Feb 26, 2024	OpenAI GymQ-Learning	—Unverified
Qgraph-bounded Q-learning: Stabilizing Model-Free Off-Policy Deep Reinforcement Learning	Jul 15, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Q-greedyUCB: a New Exploration Policy for Adaptive and Resource-efficient Scheduling	Jun 10, 2020	Decision MakingQ-Learning	—Unverified
Efficient Off-Policy Reinforcement Learning via Brain-Inspired Computing	May 14, 2022	Decision MakingQ-Learning	—Unverified
QLAMMP: A Q-Learning Agent for Optimizing Fees on Automated Market Making Protocols	Nov 28, 2022	Q-Learning	—Unverified
Q-LDA: Uncovering Latent Patterns in Text-based Sequential Decision Processes	Dec 1, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Q-Learning Algorithm for VoLTE Closed-Loop Power Control in Indoor Small Cells	Jul 10, 2017	Q-LearningReinforcement Learning	—Unverified
Q-learning as a monotone scheme	May 30, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
Q-learning Assisted Energy-Aware Traffic Offloading and Cell Switching in Heterogeneous Networks	Sep 11, 2019	Q-Learning	—Unverified
Q-Learning Based Aerial Base Station Placement for Fairness Enhancement in Mobile Networks	Sep 10, 2019	FairnessQ-Learning	—Unverified
Q-learning-based Hierarchical Cooperative Local Search for Steelmaking-continuous Casting Scheduling Problem	Jun 10, 2025	Q-LearningScheduling	—Unverified
Q-learning-based Model-free Safety Filter	Nov 29, 2024	modelQ-Learning	—Unverified
Q-learning Based Optimal False Data Injection Attack on Probabilistic Boolean Control Networks	Nov 29, 2023	Q-Learningreinforcement-learning	—Unverified
Q-Learning based system for path planning with unmanned aerial vehicles swarms in obstacle environments	Mar 30, 2023	Q-Learning	—Unverified
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
A Distributed Intelligence Architecture for B5G Network Automation	Jul 28, 2021	ManagementQ-Learning	—Unverified
Q-Learning for Continuous Actions with Cross-Entropy Guided Policies	Mar 25, 2019	Q-LearningReinforcement Learning	—Unverified
Q-Learning for MDPs with General Spaces: Convergence and Near Optimality via Quantization under Weak Continuity	Nov 12, 2021	Q-LearningQuantization	—Unverified
Mean-Field Controls with Q-learning for Cooperative MARL: Convergence and Complexity Analysis	Feb 10, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Q-learning for Optimal Control of Continuous-time Systems	Oct 11, 2014	Q-LearningReinforcement Learning	—Unverified
Q-learning for POMDP: An application to learning locomotion gaits	Sep 30, 2019	Q-Learning	—Unverified
Q-learning for real time control of heterogeneous microagent collectives	Sep 29, 2021	Q-Learning	—Unverified
Q-Learning for Stochastic Control under General Information Structures and Non-Markovian Environments	Oct 31, 2023	Q-LearningQuantization	—Unverified
q-Learning in Continuous Time	Jul 2, 2022	Learning TheoryQ-Learning	—Unverified
Q-Learning in enormous action spaces via amortized approximate maximization	Jan 22, 2020	continuous-controlContinuous Control	—Unverified
Q-Learning in Regularized Mean-field Games	Mar 24, 2020	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 21 of 39Next →

No leaderboard results yet.