Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1376–1400 of 15113 papers

Title	Date	Tasks	Status	Hype
A Reinforcement Learning Environment for Mathematical Reasoning via Program Synthesis	Jul 15, 2021	Mathematical ReasoningProgram Synthesis	CodeCode Available	1
Forgetful Experience Replay in Hierarchical Reinforcement Learning from Demonstrations	Jun 17, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	1
A Reinforcement Learning Environment For Job-Shop Scheduling	Apr 8, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Computational Performance of Deep Reinforcement Learning to find Nash Equilibria	Apr 26, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Frame Mining: a Free Lunch for Learning Robotic Manipulation from 3D Point Clouds	Oct 14, 2022	3D Point Cloud Reinforcement LearningImitation Learning	CodeCode Available	1
From Problem-Solving to Teaching Problem-Solving: Aligning LLMs with Pedagogy using Reinforcement Learning	May 21, 2025	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
From Scratch to Sketch: Deep Decoupled Hierarchical Reinforcement Learning for Robotic Sketching Agent	Aug 9, 2022	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Combining Reinforcement Learning with Lin-Kernighan-Helsgaun Algorithm for the Traveling Salesman Problem	Dec 8, 2020	Combinatorial OptimizationQ-Learning	CodeCode Available	1
Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement Learning Framework	Feb 5, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Future-conditioned Unsupervised Pretraining for Decision Transformer	May 26, 2023	Decision MakingReinforcement Learning (RL)	CodeCode Available	1
Combining Reinforcement Learning and Constraint Programming for Combinatorial Optimization	Jun 2, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Gamma and Vega Hedging Using Deep Distributional Reinforcement Learning	May 10, 2022	Distributional Reinforcement LearningPosition	CodeCode Available	1
GANterfactual-RL: Understanding Reinforcement Learning Agents' Strategies through Visual Counterfactual Explanations	Feb 24, 2023	counterfactualDecision Making	CodeCode Available	1
Aerial View Localization with Reinforcement Learning: Towards Emulating Search-and-Rescue	Sep 8, 2022	Heuristic Searchreinforcement-learning	CodeCode Available	1
A reinforcement learning path planning approach for range-only underwater target localization with autonomous vehicles	Jan 17, 2023	Autonomous VehiclesReinforcement Learning (RL)	CodeCode Available	1
Sample Efficient Reinforcement Learning via Large Vision Language Model Distillation	May 16, 2025	Decision MakingLanguage Modeling	CodeCode Available	1
Generalizable Visual Reinforcement Learning with Segment Anything Model	Dec 28, 2023	Data Augmentationmodel	CodeCode Available	1
Generalization in Reinforcement Learning by Soft Data Augmentation	Nov 26, 2020	Data Augmentationreinforcement-learning	CodeCode Available	1
A Relational Intervention Approach for Unsupervised Dynamics Generalization in Model-Based Reinforcement Learning	Jun 9, 2022	Model-based Reinforcement LearningPrediction	CodeCode Available	1
Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging	Nov 17, 2020	Autonomous DrivingModel Predictive Control	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
Combining Deep Reinforcement Learning and Search for Imperfect-Information Games	Jul 27, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Generalizing Goal-Conditioned Reinforcement Learning with Variational Causal Reasoning	Jul 19, 2022	Causal Discoveryreinforcement-learning	CodeCode Available	1
Combining Modular Skills in Multitask Learning	Feb 28, 2022	Instruction Followingreinforcement-learning	CodeCode Available	1
Reinforcement Learning for Combining Search Methods in the Calibration of Economic ABMs	Feb 23, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 56 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified