SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1726–1750 of 1918 papers

Title	Date	Tasks	Status
Meta-Value Learning: a General Framework for Learning with Learning Awareness	Jul 17, 2023	Q-Learning	CodeCode Available
Adversarial Learning of a Sampler Based on an Unnormalized Distribution	Jan 3, 2019	FormQ-Learning	CodeCode Available
Deep Q-learning: a robust control approach	Jan 21, 2022	OpenAI GymQ-Learning	CodeCode Available
Deep Ordinal Reinforcement Learning	May 6, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Imitating from auxiliary imperfect demonstrations via Adversarial Density Weighted Regression	May 28, 2024	Imitation LearningMuJoCo	CodeCode Available
Orchestrated Value Mapping for Reinforcement Learning	Mar 14, 2022	Ensemble LearningQ-Learning	CodeCode Available
Angrier Birds: Bayesian reinforcement learning	Jan 6, 2016	Efficient ExplorationQ-Learning	CodeCode Available
BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning	Oct 27, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available
Offline Contextual Bandits with Overparameterized Models	Jun 27, 2020	Multi-Armed BanditsQ-Learning	CodeCode Available
An Empirical Study of Deep Reinforcement Learning in Continuing Tasks	Jan 12, 2025	Deep Reinforcement LearningMuJoCo	CodeCode Available
Simulation of Nanorobots with Artificial Intelligence and Reinforcement Learning for Advanced Cancer Cell Detection and Tracking	Nov 4, 2024	Cell DetectionNavigate	CodeCode Available
PairVDN - Pair-wise Decomposed Value Functions	Mar 12, 2025	Q-Learning	CodeCode Available
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available
Simultaneous Double Q-learning with Conservative Advantage Learning for Actor-Critic Methods	May 8, 2022	continuous-controlContinuous Control	CodeCode Available
Mixed-Integer Optimal Control via Reinforcement Learning: A Case Study on Hybrid Electric Vehicle Energy Management	May 2, 2023	continuous-controlContinuous Control	CodeCode Available
Variation-resistant Q-learning: Controlling and Utilizing Estimation Bias in Reinforcement Learning for Better Performance	Feb 1, 2021	Q-Learningreinforcement-learning	CodeCode Available
Parallel Q-Learning: Scaling Off-policy Reinforcement Learning under Massively Parallel Simulation	Jul 24, 2023	GPUQ-Learning	CodeCode Available
Parameter-free Reduction of the Estimation Bias in Deep Reinforcement Learning for Deterministic Policy Gradients	Sep 24, 2021	continuous-controlContinuous Control	CodeCode Available
RadDQN: a Deep Q Learning-based Architecture for Finding Time-efficient Minimum Radiation Exposure Pathway	Feb 1, 2024	Decision MakingDeep Reinforcement Learning	CodeCode Available
Boosting Soft Q-Learning by Bounding	Jun 26, 2024	Q-Learning	CodeCode Available
Automaton-Guided Curriculum Generation for Reinforcement Learning Agents	Apr 11, 2023	Decision MakingQ-Learning	CodeCode Available
Variations on the Reinforcement Learning performance of Blackjack	Aug 9, 2023	Q-Learningreinforcement-learning	CodeCode Available
Model-Free Adaptive Optimal Control of Episodic Fixed-Horizon Manufacturing Processes using Reinforcement Learning	Sep 18, 2018	Model Predictive ControlQ-Learning	CodeCode Available
Deterministic Implementations for Reproducibility in Deep Reinforcement Learning	Sep 15, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Designing Neural Network Architectures using Reinforcement Learning	Nov 7, 2016	General Classificationimage-classification	CodeCode Available

Show:10 25 50

← PrevPage 70 of 77Next →

No leaderboard results yet.