Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 1918 papers

Title	Date	Tasks	Status	Hype
ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy	Feb 8, 2025	Q-LearningSafe Exploration	CodeCode Available	3
Flow Q-Learning	Feb 4, 2025	Action GenerationD4RL	CodeCode Available	3
Streaming Deep Reinforcement Learning Finally Works	Oct 18, 2024	Atari GamesDeep Reinforcement Learning	CodeCode Available	3
Simplifying Deep Temporal Difference Learning	Jul 5, 2024	Q-LearningReinforcement Learning (RL)	CodeCode Available	3
Digi-Q: Learning Q-Value Functions for Training Device-Control Agents	Feb 13, 2025	Q-LearningReinforcement Learning (RL)	CodeCode Available	2
Pretrained LLM Adapted with LoRA as a Decision Transformer for Offline RL in Quantitative Trading	Nov 26, 2024	Offline RLparameter-efficient fine-tuning	CodeCode Available	2
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather	Jul 2, 2024	Data AugmentationLIDAR Semantic Segmentation	CodeCode Available	2
Safe Multi-Agent Reinforcement Learning with Bilevel Optimization in Autonomous Driving	May 28, 2024	Autonomous DrivingBilevel Optimization	CodeCode Available	2
Ensembling Prioritized Hybrid Policies for Multi-agent Pathfinding	Mar 12, 2024	Multi-Agent Path FindingMulti-agent Reinforcement Learning	CodeCode Available	2
Efficient Episodic Memory Utilization of Cooperative Multi-Agent Reinforcement Learning	Mar 2, 2024	DecoderMulti-agent Reinforcement Learning	CodeCode Available	2
ACE: Cooperative Multi-agent Q-learning with Bidirectional Action-Dependency	Nov 29, 2022	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning	Aug 12, 2022	D4RLOffline RL	CodeCode Available	2
Offline RL for Natural Language Generation with Implicit Language Q Learning	Jun 5, 2022	Language ModellingOffline RL	CodeCode Available	2
rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch	Sep 3, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	2
POPGym Arcade: Parallel Pixelated POMDPs	Mar 3, 2025	counterfactualImitation Learning	CodeCode Available	1
Zonal RL-RRT: Integrated RL-RRT Path Planning with Collision Probability and Zone Connectivity	Oct 31, 2024	MuJoCoQ-Learning	CodeCode Available	1
Reward-free World Models for Online Imitation Learning	Oct 17, 2024	Imitation LearningQ-Learning	CodeCode Available	1
Reinforcement Learning in High-frequency Market Making	Jul 14, 2024	Q-Learningreinforcement-learning	CodeCode Available	1
Q-Adapter: Customizing Pre-trained LLMs to New Preferences with Forgetting Mitigation	Jul 4, 2024	Q-Learningreinforcement-learning	CodeCode Available	1
PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer	Jun 10, 2024	continuous-controlContinuous Control	CodeCode Available	1
Strategically Conservative Q-Learning	Jun 6, 2024	D4RLOffline RL	CodeCode Available	1
Towards Universal and Black-Box Query-Response Only Attack on LLMs with QROA	Jun 4, 2024	Q-Learning	CodeCode Available	1
Diffusion Policies creating a Trust Region for Offline Reinforcement Learning	May 30, 2024	D4RLDenoising	CodeCode Available	1
A Recipe for Unbounded Data Augmentation in Visual Reinforcement Learning	May 27, 2024	Data AugmentationQ-Learning	CodeCode Available	1
Research on Robot Path Planning Based on Reinforcement Learning	Apr 22, 2024	Q-Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 77Next →

No leaderboard results yet.