Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6001–6025 of 15113 papers

Title	Date	Tasks	Status
Learning Real-World Robot Policies by Dreaming	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning Relative Return Policies With Upside-Down Reinforcement Learning	Feb 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning Representations in Model-Free Hierarchical Reinforcement Learning	Oct 23, 2018	Hierarchical Reinforcement Learningmodel	—Unverified
Learning Representations in Reinforcement Learning: an Information Bottleneck Approach	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Retrospective Knowledge with Reverse Reinforcement Learning	Jul 9, 2020	Anomaly Detectionreinforcement-learning	—Unverified
Learning Reusable Options for Multi-Task Reinforcement Learning	Jan 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Reward Machines: A Study in Partially Observable Reinforcement Learning	Dec 17, 2021	Partially Observable Reinforcement LearningProblem Decomposition	—Unverified
Learning Rewards to Optimize Global Performance Metrics in Deep Reinforcement Learning	Mar 16, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Learning Robotic Assembly from CAD	Mar 20, 2018	Contact-rich ManipulationMotion Planning	—Unverified
Learning Robotic Manipulation Skills Using an Adaptive Force-Impedance Action Space	Oct 19, 2021	Contact-rich ManipulationDecision Making	—Unverified
Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning	May 3, 2024	Deep Reinforcement LearningObject Tracking	—Unverified
Learning Robust Autonomous Navigation and Locomotion for Wheeled-Legged Robots	May 3, 2024	Autonomous NavigationNavigate	—Unverified
Learning Robust Controllers Via Probabilistic Model-Based Policy Search	Oct 26, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning Robust Rewards with Adverserial Inverse Reinforcement Learning	Jan 1, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Routines for Effective Off-Policy Reinforcement Learning	Jun 5, 2021	Computational Efficiencyreinforcement-learning	—Unverified
Learning Runtime Parameters in Computer Systems with Delayed Experience Injection	Oct 31, 2016	CPUDeep Reinforcement Learning	—Unverified
Learning Safe Policies with Cost-sensitive Advantage Estimation	Jan 1, 2021	Reinforcement Learning (RL)	—Unverified
Learning Safe Policies with Expert Guidance	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning safety critics via a non-contractive binary bellman operator	Jan 23, 2024	Reinforcement Learning (RL)	—Unverified
Learning Sampling Policy for Faster Derivative Free Optimization	Apr 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning Security Strategies through Game Play and Optimal Stopping	May 29, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning Self-Game-Play Agents for Combinatorial Optimization Problems	Mar 8, 2019	Atari GamesBoard Games	—Unverified
Learning Shaping Strategies in Human-in-the-loop Interactive Reinforcement Learning	Nov 10, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning Shared Representations in Multi-task Reinforcement Learning	Mar 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories	Dec 7, 2024	Imitation LearningMotion Planning	—Unverified

Show:10 25 50

← PrevPage 241 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified