SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1326–1350 of 1918 papers

Title	Date	Tasks	Status
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
Near-Optimal Regret Bounds for Model-Free RL in Non-Stationary Episodic MDPs	Sep 28, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Model-Free Non-Stationary RL: Near-Optimal Regret and Applications in Multi-Agent RL and Inventory Control	Oct 7, 2020	Computational EfficiencyQ-Learning	—Unverified
Near-Optimal Reinforcement Learning with Self-Play	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Neighborhood Cognition Consistent Multi-Agent Reinforcement Learning	Dec 3, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Compositional Q-learning for electrolyte repletion with imbalanced patient sub-populations	Oct 6, 2021	Decision MakingNavigate	—Unverified
Networked Control of Nonlinear Systems under Partial Observation Using Continuous Deep Q-Learning	Aug 28, 2019	Q-Learning	—Unverified
Hyperparameter optimization with REINFORCE and Transformers	Jun 1, 2020	BenchmarkingHyperparameter Optimization	—Unverified
Neural-Kernel Conditional Mean Embeddings	Mar 16, 2024	Deep LearningDensity Estimation	—Unverified
Neural Network Based Reinforcement Learning for Audio-Visual Gaze Control in Human-Robot Interaction	Nov 18, 2017	parameter estimationQ-Learning	—Unverified
Neural-Network-Driven Reward Prediction as a Heuristic: Advancing Q-Learning for Mobile Robot Path Planning	Dec 17, 2024	Q-Learning	—Unverified
Neural networks with motivation	Jun 23, 2019	Hierarchical Reinforcement LearningNavigate	—Unverified
Neural Q-learning for solving PDEs	Mar 31, 2022	Q-Learning	—Unverified
Neural Temporal-Difference Learning Converges to Global Optima	Dec 1, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Neurohex: A Deep Q-learning Hex Agent	Apr 24, 2016	Atari GamesGame of Go	—Unverified
Neuromimetic Linear Systems -- Resilience and Learning	May 10, 2022	Combinatorial OptimizationQ-Learning	—Unverified
Non-Asymptotic Guarantees for Average-Reward Q-Learning with Adaptive Stepsizes	Apr 25, 2025	Q-Learning	—Unverified
Non-delusional Q-learning and value-iteration	Dec 1, 2018	Q-Learning	—Unverified
No-Regret Reinforcement Learning with Heavy-Tailed Rewards	Feb 25, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Numeric Reward Machines	Apr 30, 2024	Q-Learning	—Unverified
Object Goal Navigation using Data Regularized Q-Learning	Aug 27, 2022	Data AugmentationDeep Reinforcement Learning	—Unverified
Off-line approximate dynamic programming for the vehicle routing problem with a highly variable customer basis and stochastic demands	Sep 21, 2021	Decision MakingQ-Learning	—Unverified
Offline Decentralized Multi-Agent Reinforcement Learning	Aug 4, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Offline Deep Reinforcement Learning for Dynamic Pricing of Consumer Credit	Mar 6, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
OER: Offline Experience Replay for Continual Offline Reinforcement Learning	May 23, 2023	Continual LearningMuJoCo	—Unverified

Show:10 25 50

← PrevPage 54 of 77Next →

No leaderboard results yet.