Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–6000 of 15113 papers

Title	Date	Tasks	Status
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Making by Reinforcement Learning	May 21, 2021	Decision MakingReinforcement Learning (RL)	—Unverified
Learning in Mean Field Games: A Survey	May 25, 2022	Reinforcement Learning (RL)Survey	—Unverified
Learning medical triage from clinicians using Deep Q-Learning	Mar 28, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Memory-Dependent Continuous Control from Demonstrations	Feb 18, 2021	continuous-controlContinuous Control	—Unverified
Data-Driven Merton's Strategies via Policy Randomization	Dec 19, 2023	Reinforcement Learning (RL)	—Unverified
Learning Meta Representations for Agents in Multi-Agent Reinforcement Learning	Aug 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning Mobile Robot Navigation in the Dense Crowd with Deep Reinforcement Learning	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer	Sep 22, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Decision Making in Monopoly using a Hybrid Deep Reinforcement Learning Approach	Mar 1, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Montezuma's Revenge from a Single Demonstration	Dec 8, 2018	Montezuma's Revengereinforcement-learning	—Unverified
Learning Multi-Agent Intention-Aware Communication for Optimal Multi-Order Execution in Finance	Jul 6, 2023	Reinforcement Learning (RL)	—Unverified
Learning Multi-Task Transferable Rewards via Variational Inverse Reinforcement Learning	Jun 19, 2022	Generative Adversarial NetworkImitation Learning	—Unverified
Learning Natural Language Generation from Scratch	Sep 20, 2021	Language ModelingLanguage Modelling	—Unverified
Learning Navigation Behaviors End-to-End with AutoRL	Sep 26, 2018	Deep Reinforcement LearningMotion Planning	—Unverified
Learning Near Optimal Policies with Low Inherent Bellman Error	Feb 29, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Not to Spoof	Jun 9, 2023	Reinforcement Learning (RL)	—Unverified
Learning objects from pixels	Jan 1, 2018	Atari GamesObject	—Unverified
Learning offline: memory replay in biological and artificial reinforcement learning	Sep 21, 2021	Continual LearningDecision Making	—Unverified
Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration	Mar 31, 2024	continuous-controlContinuous Control	—Unverified
Learning on Abstract Domains: A New Approach for Verifiable Guarantee in Reinforcement Learning	Jun 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Online Policies for Person Tracking in Multi-View Environments	Dec 26, 2023	Human DetectionReinforcement Learning (RL)	—Unverified
Learning on the Job: Long-Term Behavioural Adaptation in Human-Robot Interactions	Mar 20, 2022	Reinforcement Learning (RL)	—Unverified
Learning Open Domain Multi-hop Search Using Reinforcement Learning	May 30, 2022	Information RetrievalReading Comprehension	—Unverified
Learning Optimal Deterministic Policies with Stochastic Policy Gradients	May 3, 2024	Reinforcement Learning (RL)	—Unverified
Learning Optimal Strategies for Temporal Tasks in Stochastic Games	Feb 8, 2021	Reinforcement Learning (RL)	—Unverified
Learning Optimal Treatment Strategies for Sepsis Using Offline Reinforcement Learning in Continuous Space	Jun 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning optimal treatment strategies for intraoperative hypotension using deep reinforcement learning	May 27, 2025	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Options from Demonstration using Skill Segmentation	Jan 19, 2020	Clusteringreinforcement-learning	—Unverified
Learning over All Stabilizing Nonlinear Controllers for a Partially-Observed Linear System	Dec 8, 2021	AllReinforcement Learning (RL)	—Unverified
Learning Parsimonious Dynamics for Generalization in Reinforcement Learning	Sep 29, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning Partially Observable Deterministic Action Models	Jan 15, 2014	Partially Observable Reinforcement Learningreinforcement-learning	—Unverified
Learning Perception-Aware Agile Flight in Cluttered Environments	Oct 4, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified
Learning Personalized Discretionary Lane-Change Initiation for Fully Autonomous Driving Based on Reinforcement Learning	Oct 29, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
Learning Personalized Human-Aware Robot Navigation Using Virtual Reality Demonstrations from a User Study	Mar 28, 2022	Reinforcement Learning (RL)Robot Navigation	—Unverified
Learning Pessimism for Robust and Efficient Off-Policy Reinforcement Learning	Oct 7, 2021	Continuous ControlDeep Reinforcement Learning	—Unverified
Learning Physics Priors for Deep Reinforcement Learing	Sep 27, 2018	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning Plasma Dynamics and Robust Rampdown Trajectories with Predict-First Experiments at TCV	Feb 17, 2025	Reinforcement Learning (RL)	—Unverified
Learning Policy Representations in Multiagent Systems	Jun 17, 2018	Clusteringcontinuous-control	—Unverified
Learning Polynomial Representations of Physical Objects with Application to Certifying Correct Packing Configurations	Dec 11, 2023	ObjectOne-Class Classification	—Unverified
Learning Power Control from a Fixed Batch of Data	Aug 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning	Sep 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning Predictive Communication by Imagination in Networked System Control	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning predictive representations in autonomous driving to improve deep reinforcement learning	Jun 26, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Learning Predictive Safety Filter via Decomposition of Robust Invariant Set	Nov 12, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Inferring Probabilistic Reward Machines from Non-Markovian Reward Processes for Reinforcement Learning	Jul 9, 2021	Decision Makingreinforcement-learning	—Unverified
Learning proposals for sequential importance samplers using reinforced variational inference	Mar 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning Proxemic Behavior Using Reinforcement Learning with Cognitive Agents	Aug 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Learning Quadruped Locomotion Policies using Logical Rules	Jul 23, 2021	DiversityReinforcement Learning (RL)	—Unverified
Learning Realistic Traffic Agents in Closed-loop	Nov 2, 2023	Imitation LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 120 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified