SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1176–1200 of 1918 papers

Title	Date	Tasks	Status
Reinforcement Learning with Structured Hierarchical Grammar Representations of Actions	Oct 7, 2019	Atari GamesQ-Learning	—Unverified
Reinforcenment Learning-Aided NOMA Random Access: An AoI-Based Timeliness Perspective	Oct 4, 2024	Q-Learning	—Unverified
A Framework of decision-relevant observability: Reinforcement Learning converges under relative ignorability	Apr 10, 2025	Causal InferenceDecision Making	—Unverified
RELS-DQN: A Robust and Efficient Local Search Framework for Combinatorial Optimization	Apr 11, 2023	Combinatorial OptimizationMarketing	—Unverified
Replay For Safety	Dec 8, 2021	Q-Learning	—Unverified
Representation Learning for Context-Dependent Decision-Making	May 12, 2022	Decision MakingQ-Learning	—Unverified
Representing Entropy : A short proof of the equivalence between soft Q-learning and policy gradients	Jan 1, 2018	Q-Learningreinforcement-learning	—Unverified
Reputation Bootstrapping for Composite Services using CP-nets	May 27, 2021	Q-Learning	—Unverified
Residual Policy Gradient: A Reward View of KL-regularized Objective	Mar 14, 2025	Imitation LearningMuJoCo	—Unverified
Residual Q-Learning: Offline and Online Policy Customization without Value	Jun 15, 2023	Imitation LearningQ-Learning	—Unverified
Resilient UAV Trajectory Planning via Few-Shot Meta-Offline Reinforcement Learning	Feb 3, 2025	Meta-LearningOffline RL	—Unverified
The state-of-the-art review on resource allocation problem using artificial intelligence methods on various computing paradigms	Mar 23, 2022	Cloud ComputingDeep Reinforcement Learning	—Unverified
REValueD: Regularised Ensemble Value-Decomposition for Factorisable Markov Decision Processes	Jan 16, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Reverse Experience Replay	Oct 19, 2019	Q-Learning	—Unverified
Reversible Action Design for Combinatorial Optimization with Reinforcement Learning	Feb 14, 2021	Combinatorial OptimizationQ-Learning	—Unverified
Reversible Action Design for Combinatorial Optimization with ReinforcementLearning	Nov 24, 2021	Combinatorial OptimizationQ-Learning	—Unverified
Reward-Directed Score-Based Diffusion Models via q-Learning	Sep 7, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Risk-Averse Reinforcement Learning via Dynamic Time-Consistent Risk Measures	Jan 14, 2023	Q-Learningreinforcement-learning	—Unverified
Risk-Sensitive Compact Decision Trees for Autonomous Execution in Presence of Simulated Market Response	Jun 5, 2019	Q-Learningreinforcement-learning	—Unverified
Risk-sensitive Reinforcement Learning	Nov 8, 2013	Decision MakingQ-Learning	—Unverified
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
RL-GA: A Reinforcement Learning-Based Genetic Algorithm for Electromagnetic Detection Satellite Scheduling Problem	Jun 12, 2022	Q-Learningreinforcement-learning	—Unverified
Robbins-Monro conditions for persistent exploration learning strategies	Aug 1, 2018	Q-Learning	—Unverified
Robotic Search & Rescue via Online Multi-task Reinforcement Learning	Nov 29, 2015	Lifelong learningQ-Learning	—Unverified
Robust and Data-efficient Q-learning by Composite Value-estimation	Sep 29, 2021	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 48 of 77Next →

No leaderboard results yet.