Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5451–5475 of 15113 papers

Title	Date	Tasks	Status
Robotic Lever Manipulation using Hindsight Experience Replay and Shapley Additive Explanations	Oct 7, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robotic Offline RL from Internet Videos via Value-Function Pre-Training	Sep 22, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Robotic Search & Rescue via Online Multi-task Reinforcement Learning	Nov 29, 2015	Lifelong learningQ-Learning	—Unverified
Robotic self-representation improves manipulation skills and transfer learning	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Robotic Table Tennis with Model-Free Reinforcement Learning	Mar 31, 2020	modelreinforcement-learning	—Unverified
Robotic Table Wiping via Reinforcement Learning and Whole-body Trajectory Optimization	Oct 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Robotic Tracking Control with Kernel Trick-based Reinforcement Learning	Nov 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Robot in a China Shop: Using Reinforcement Learning for Location-Specific Navigation Behaviour	Jun 2, 2021	Multi-Task LearningReinforcement Learning (RL)	—Unverified
Robot Learning of Mobile Manipulation with Reachability Behavior Priors	Mar 8, 2022	Reinforcement Learning (RL)	—Unverified
Robot Navigation with Reinforcement Learned Path Generation and Fine-Tuned Motion Control	Oct 19, 2022	Reinforcement Learning (RL)Robot Navigation	—Unverified
Robot path planning using deep reinforcement learning	Feb 17, 2023	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Robot Policy Learning from Demonstration Using Advantage Weighting and Early Termination	Jul 31, 2022	Imitation Learningreinforcement-learning	—Unverified
Robot Representation and Reasoning with Knowledge from Reinforcement Learning	Sep 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
Robots and Children that Learn Together : Improving Knowledge Retention by Teaching Peer-Like Interactive Robots	Jun 23, 2025	MemorizationReinforcement Learning (RL)	—Unverified
Robot See, Robot Do: Imitation Reward for Noisy Financial Environments	Nov 13, 2024	Decision MakingImitation Learning	—Unverified
Robot Sound Interpretation: Combining Sight and Sound in Learning-Based Control	Sep 19, 2019	Decision Makingreinforcement-learning	—Unverified
Robust Action Governor for Uncertain Piecewise Affine Systems with Non-convex Constraints and Safe Reinforcement Learning	Jul 17, 2022	RAGReinforcement Learning (RL)	—Unverified
Robust Adversarial Attacks Detection based on Explainable Deep Reinforcement Learning For UAV Guidance and Planning	Jun 6, 2022	Adversarial AttackDecision Making	—Unverified
Robust Adversarial Reinforcement Learning via Bounded Rationality Curricula	Nov 3, 2023	MuJoCoreinforcement-learning	—Unverified
Robust Algorithmic Collusion	Jan 2, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Robust Android Malware Detection System against Adversarial Attacks using Q-Learning	Jan 27, 2021	Adversarial DefenseAndroid Malware Detection	—Unverified
Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for MANETs	Jan 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Robust and Versatile Bipedal Jumping Control through Reinforcement Learning	Feb 19, 2023	reinforcement-learningReinforcement Learning	—Unverified
Robusta: Robust AutoML for Feature Selection via Reinforcement Learning	Jan 15, 2021	AutoMLFeature Importance	—Unverified
Robust Auto-landing Control of an agile Regional Jet Using Fuzzy Q-learning	Feb 21, 2023	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 219 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified