Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8176–8200 of 15113 papers

Title	Date	Tasks	Status
Particle Swarm Optimization for Generating Interpretable Fuzzy Reinforcement Learning Policies	Oct 19, 2016	reinforcement-learningReinforcement Learning	—Unverified
Particle Value Functions	Mar 16, 2017	reinforcement-learningReinforcement Learning	—Unverified
Partitioning Distributed Compute Jobs with Reinforcement Learning and Graph Neural Networks	Jan 31, 2023	BlockingGraph Neural Network	—Unverified
Partner Approximating Learners (PAL): Simulation-Accelerated Learning with Explicit Partner Modeling in Multi-Agent Domains	Sep 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
Partner Personas Generation for Dialogue Response Generation	Jul 1, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
PassGoodPool: Joint Passengers and Goods Fleet Management with Reinforcement Learning aided Pricing, Matching, and Route Planning	Nov 17, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Passing Through Narrow Gaps with Deep Reinforcement Learning	Mar 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Pass@K Policy Optimization: Solving Harder Reinforcement Learning Problems	May 21, 2025	reinforcement-learningReinforcement Learning	—Unverified
Path Design and Resource Management for NOMA enhanced Indoor Intelligent Robots	Nov 23, 2020	Managementreinforcement-learning	—Unverified
Pathfinding in Random Partially Observable Environments with Vision-Informed Deep Reinforcement Learning	Sep 11, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Path Following and Stabilisation of a Bicycle Model using a Reinforcement Learning Approach	Jul 24, 2024	Reinforcement Learning (RL)	—Unverified
Path Integral Networks: End-to-End Differentiable Optimal Control	Jun 29, 2017	continuous-controlContinuous Control	—Unverified
Machine learning strategies for path-planning microswimmers in turbulent flows	Oct 3, 2019	BIG-bench Machine LearningPosition	—Unverified
Path Planning of Cleaning Robot with Reinforcement Learning	Aug 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
Path Planning using Reinforcement Learning: A Policy Iteration Approach	Mar 13, 2023	reinforcement-learningReinforcement Learning	—Unverified
Patient level simulation and reinforcement learning to discover novel strategies for treating ovarian cancer	Oct 22, 2021	Prognosisreinforcement-learning	—Unverified
Patterns, predictions, and actions: A story about machine learning	Feb 10, 2021	BIG-bench Machine LearningCausal Inference	—Unverified
Pattern Transfer Learning for Reinforcement Learning in Order Dispatching	May 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Pauli Network Circuit Synthesis with Reinforcement Learning	Mar 18, 2025	reinforcement-learningReinforcement Learning	—Unverified
Paused Agent Replay Refresh	Sep 26, 2022	Montezuma's Revengereinforcement-learning	—Unverified
Pavlovian Signalling with General Value Functions in Agent-Agent Temporal Decision Making	Jan 11, 2022	Decision Makingreinforcement-learning	—Unverified
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning	Apr 24, 2020	continuous-controlContinuous Control	—Unverified
PDQN - A Deep Reinforcement Learning Method for Planning with Long Delays: Optimization of Manufacturing Dispatching	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
PEARL: Parallelized Expert-Assisted Reinforcement Learning for Scene Rearrangement Planning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
PEAR: Primitive enabled Adaptive Relabeling for boosting Hierarchical Reinforcement Learning	Jun 10, 2023	Decision MakingHierarchical Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 328 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified