Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8801–8825 of 15113 papers

Title	Date	Tasks	Status
Passing Through Narrow Gaps with Deep Reinforcement Learning	Mar 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Pass@K Policy Optimization: Solving Harder Reinforcement Learning Problems	May 21, 2025	reinforcement-learningReinforcement Learning	—Unverified
Path Design and Resource Management for NOMA enhanced Indoor Intelligent Robots	Nov 23, 2020	Managementreinforcement-learning	—Unverified
Pathfinding in Random Partially Observable Environments with Vision-Informed Deep Reinforcement Learning	Sep 11, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Path Following and Stabilisation of a Bicycle Model using a Reinforcement Learning Approach	Jul 24, 2024	Reinforcement Learning (RL)	—Unverified
Path Integral Networks: End-to-End Differentiable Optimal Control	Jun 29, 2017	continuous-controlContinuous Control	—Unverified
Machine learning strategies for path-planning microswimmers in turbulent flows	Oct 3, 2019	BIG-bench Machine LearningPosition	—Unverified
Path Planning of Cleaning Robot with Reinforcement Learning	Aug 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
Path Planning using Reinforcement Learning: A Policy Iteration Approach	Mar 13, 2023	reinforcement-learningReinforcement Learning	—Unverified
Patient level simulation and reinforcement learning to discover novel strategies for treating ovarian cancer	Oct 22, 2021	Prognosisreinforcement-learning	—Unverified
Patterns, predictions, and actions: A story about machine learning	Feb 10, 2021	BIG-bench Machine LearningCausal Inference	—Unverified
Pattern Transfer Learning for Reinforcement Learning in Order Dispatching	May 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Pauli Network Circuit Synthesis with Reinforcement Learning	Mar 18, 2025	reinforcement-learningReinforcement Learning	—Unverified
Paused Agent Replay Refresh	Sep 26, 2022	Montezuma's Revengereinforcement-learning	—Unverified
Pavlovian Signalling with General Value Functions in Agent-Agent Temporal Decision Making	Jan 11, 2022	Decision Makingreinforcement-learning	—Unverified
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning	Apr 24, 2020	continuous-controlContinuous Control	—Unverified
PDQN - A Deep Reinforcement Learning Method for Planning with Long Delays: Optimization of Manufacturing Dispatching	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
PEARL: Parallelized Expert-Assisted Reinforcement Learning for Scene Rearrangement Planning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
PEAR: Primitive enabled Adaptive Relabeling for boosting Hierarchical Reinforcement Learning	Jun 10, 2023	Decision MakingHierarchical Reinforcement Learning	—Unverified
Pedestrian Prediction by Planning using Deep Neural Networks	Jun 19, 2017	Autonomous VehiclesCollision Avoidance	—Unverified
Penalized Proximal Policy Optimization for Safe Reinforcement Learning	May 24, 2022	reinforcement-learningReinforcement Learning	—Unverified
PEORL: Integrating Symbolic Planning and Hierarchical Reinforcement Learning for Robust Decision-Making	Apr 20, 2018	Decision MakingHierarchical Reinforcement Learning	—Unverified
Perception and Navigation in Autonomous Systems in the Era of Learning: A Survey	Jan 8, 2020	Autonomous NavigationDecision Making	—Unverified
Perception-Prediction-Reaction Agents for Deep Reinforcement Learning	Jun 26, 2020	Deep Reinforcement LearningPrediction	—Unverified
Perceptual Reward Functions	Aug 12, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 353 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified