Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5126–5150 of 15113 papers

Title	Date	Tasks	Status	Hype
Learning Bipedal Walking On Planned Footsteps For Humanoid Robots	Jul 26, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available	3
Offline Reinforcement Learning at Multiple Frequencies	Jul 26, 2022	Offline RLreinforcement-learning	—Unverified	0
Semi-analytical Industrial Cooling System Model for Reinforcement Learning	Jul 26, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Planning and Learning: Path-Planning for Autonomous Vehicles, a Review of the Literature	Jul 26, 2022	Autonomous Vehiclesreinforcement-learning	—Unverified	0
Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning	Jul 25, 2022	Natural Language Understandingreinforcement-learning	—Unverified	0
Cooperative Actor-Critic via TD Error Aggregation	Jul 25, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Flowsheet synthesis through hierarchical reinforcement learning and graph neural networks	Jul 25, 2022	Chemical ProcessDecision Making	—Unverified	0
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available	0
Online Reinforcement Learning for Periodic MDP	Jul 25, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Asynchronous Control Using Meta-learned Neural Ordinary Differential Equations	Jul 25, 2022	Decision MakingMeta-Learning	—Unverified	0
Post-processing Networks: Method for Optimizing Pipeline Task-oriented Dialogue Systems using Reinforcement Learning	Jul 25, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
REPNP: Plug-and-Play with Deep Reinforcement Learning Prior for Robust Image Restoration	Jul 25, 2022	DeblurringDeep Reinforcement Learning	—Unverified	0
Lifelong Machine Learning of Functionally Compositional Structures	Jul 25, 2022	BIG-bench Machine LearningContinual Learning	CodeCode Available	1
Learning Soccer Juggling Skills with Layer-wise Mixture-of-Experts	Jul 24, 2022	Deep Reinforcement LearningHumanoid Control	CodeCode Available	1
Adaptive Decision Making at the Intersection for Autonomous Vehicles Based on Skill Discovery	Jul 24, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System	Jul 24, 2022	Reinforcement Learning (RL)	—Unverified	0
Driver Dojo: A Benchmark for Generalizable Reinforcement Learning for Autonomous Driving	Jul 23, 2022	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Halftoning with Multi-Agent Deep Reinforcement Learning	Jul 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Epersist: A Self Balancing Robot Using PID Controller And Deep Reinforcement Learning	Jul 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Hierarchical Kickstarting for Skill Transfer in Reinforcement Learning	Jul 23, 2022	Inductive BiasNetHack	CodeCode Available	1
Learn Continuously, Act Discretely: Hybrid Action-Space Reinforcement Learning For Optimal Execution	Jul 22, 2022	Algorithmic Tradingcontinuous-control	—Unverified	0
Robust Knowledge Adaptation for Dynamic Graph Neural Networks	Jul 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement Learning	Jul 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Solving the optimal stopping problem with reinforcement learning: an application in financial option exercise	Jul 21, 2022	ManagementReinforcement Learning (RL)	CodeCode Available	0
Strategising template-guided needle placement for MR-targeted prostate biopsy	Jul 21, 2022	AnatomyDecision Making	—Unverified	0

Show:10 25 50

← PrevPage 206 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified