Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5976–6000 of 15113 papers

Title	Date	Tasks	Status
Learning Optimal Treatment Strategies for Sepsis Using Offline Reinforcement Learning in Continuous Space	Jun 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning optimal treatment strategies for intraoperative hypotension using deep reinforcement learning	May 27, 2025	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Options from Demonstration using Skill Segmentation	Jan 19, 2020	Clusteringreinforcement-learning	—Unverified
Learning over All Stabilizing Nonlinear Controllers for a Partially-Observed Linear System	Dec 8, 2021	AllReinforcement Learning (RL)	—Unverified
Learning Parsimonious Dynamics for Generalization in Reinforcement Learning	Sep 29, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning Partially Observable Deterministic Action Models	Jan 15, 2014	Partially Observable Reinforcement Learningreinforcement-learning	—Unverified
Learning Perception-Aware Agile Flight in Cluttered Environments	Oct 4, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified
Learning Personalized Discretionary Lane-Change Initiation for Fully Autonomous Driving Based on Reinforcement Learning	Oct 29, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
Learning Personalized Human-Aware Robot Navigation Using Virtual Reality Demonstrations from a User Study	Mar 28, 2022	Reinforcement Learning (RL)Robot Navigation	—Unverified
Learning Pessimism for Robust and Efficient Off-Policy Reinforcement Learning	Oct 7, 2021	Continuous ControlDeep Reinforcement Learning	—Unverified
Learning Physics Priors for Deep Reinforcement Learing	Sep 27, 2018	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning Plasma Dynamics and Robust Rampdown Trajectories with Predict-First Experiments at TCV	Feb 17, 2025	Reinforcement Learning (RL)	—Unverified
Learning Policy Representations in Multiagent Systems	Jun 17, 2018	Clusteringcontinuous-control	—Unverified
Learning Polynomial Representations of Physical Objects with Application to Certifying Correct Packing Configurations	Dec 11, 2023	ObjectOne-Class Classification	—Unverified
Learning Power Control from a Fixed Batch of Data	Aug 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning	Sep 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning Predictive Communication by Imagination in Networked System Control	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning predictive representations in autonomous driving to improve deep reinforcement learning	Jun 26, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Learning Predictive Safety Filter via Decomposition of Robust Invariant Set	Nov 12, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Inferring Probabilistic Reward Machines from Non-Markovian Reward Processes for Reinforcement Learning	Jul 9, 2021	Decision Makingreinforcement-learning	—Unverified
Learning proposals for sequential importance samplers using reinforced variational inference	Mar 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning Proxemic Behavior Using Reinforcement Learning with Cognitive Agents	Aug 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Learning Quadruped Locomotion Policies using Logical Rules	Jul 23, 2021	DiversityReinforcement Learning (RL)	—Unverified
Learning Realistic Traffic Agents in Closed-loop	Nov 2, 2023	Imitation LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 240 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified