Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5776–5800 of 15113 papers

Title	Date	Tasks	Status
LASER: Learning a Latent Action Space for Efficient Reinforcement Learning	Mar 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Latent-Conditioned Policy Gradient for Multi-Objective Deep Reinforcement Learning	Mar 15, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
Latent forward model for Real-time Strategy game planning with incomplete information	Jan 1, 2018	Atari GamesDecision Making	—Unverified
LatentPoison -- Adversarial Attacks On The Latent Space	Jan 1, 2018	DecoderGeneral Classification	—Unverified
Latent Properties of Lifelong Learning Systems	Jul 28, 2022	Lifelong learningreinforcement-learning	—Unverified
Latent Space Policies for Hierarchical Reinforcement Learning	Apr 9, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Latent Space Reinforcement Learning for Steering Angle Prediction	Feb 11, 2019	Deep Reinforcement LearningPrediction	—Unverified
Latent Variable Representation for Reinforcement Learning	Dec 17, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified
LAVA: Latent Action Spaces via Variational Auto-encoding for Dialogue Policy Optimization	Nov 18, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Laxity-Aware Scalable Reinforcement Learning for HVAC Control	Jun 29, 2023	reinforcement-learningReinforcement Learning	—Unverified
Lazy-MDPs: Towards Interpretable Reinforcement Learning by Learning When to Act	Mar 16, 2022	Atari GamesDecision Making	—Unverified
LBGP: Learning Based Goal Planning for Autonomous Following in Front	Nov 5, 2020	Deep Reinforcement LearningNavigate	—Unverified
LDSA: Learning Dynamic Subtask Assignment in Cooperative Multi-Agent Reinforcement Learning	May 5, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Leader Reward for POMO-Based Neural Combinatorial Optimization	May 22, 2024	Combinatorial OptimizationReinforcement Learning (RL)	—Unverified
Multitask Neuroevolution for Reinforcement Learning with Long and Short Episodes	Mar 21, 2022	continuous-controlContinuous Control	—Unverified
Learn 2 Rage: Experiencing The Emotional Roller Coaster That Is Reinforcement Learning	Oct 24, 2024	Autonomous DrivingAutonomous Racing	—Unverified
Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection	May 9, 2023	Atari GamesDeep Reinforcement Learning	—Unverified
Learnable Triangulation for Deep Learning-based 3D Reconstruction of Objects of Arbitrary Topology from Single RGB Images	Sep 24, 2021	3D Object Reconstruction3D Reconstruction	—Unverified
Learn A Flexible Exploration Model for Parameterized Action Markov Decision Processes	Jan 6, 2025	Reinforcement Learning (RL)	—Unverified
LearnAlign: Reasoning Data Selection for Reinforcement Learning in Large Language Models Based on Improved Gradient Alignment	Jun 13, 2025	GSM8KMathematical Reasoning	—Unverified
Learn Continuously, Act Discretely: Hybrid Action-Space Reinforcement Learning For Optimal Execution	Jul 22, 2022	Algorithmic Tradingcontinuous-control	—Unverified
Learned Controllers for Agile Quadrotors in Pursuit-Evasion Games	Jun 3, 2025	Continual LearningReinforcement Learning (RL)	—Unverified
Learned Graph Rewriting with Equality Saturation: A New Paradigm in Relational Query Rewrite and Beyond	Jun 19, 2024	Decision Makingreinforcement-learning	—Unverified
Learn Fine-grained Adaptive Loss for Multiple Anatomical Landmark Detection in Medical Images	May 19, 2021	Anatomical Landmark DetectionAnatomy	—Unverified

Show:10 25 50

← PrevPage 232 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified