Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5501–5525 of 15113 papers

Title	Date	Tasks	Status
Robust Log-Optimal Strategy with Reinforcement Learning	May 1, 2018	Managementreinforcement-learning	—Unverified
Robust Longitudinal Control for Vehicular Autonomous Platoons Using Deep Reinforcement Learning	May 31, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Meta-Reinforcement Learning with Curriculum-Based Task Sampling	Mar 31, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified
Robust Model-based Reinforcement Learning for Autonomous Greenhouse Control	Aug 26, 2021	Decision MakingModel-based Reinforcement Learning	—Unverified
Robust Model Predictive Shielding for Safe Reinforcement Learning with Stochastic Dynamics	Oct 24, 2019	Learning Theoryreinforcement-learning	—Unverified
Robust Multi-Agent Reinforcement Learning Driven by Correlated Equilibrium	Jan 1, 2021	Adversarial RobustnessMulti-agent Reinforcement Learning	—Unverified
Robust Multi-Agent Reinforcement Learning with Model Uncertainty	Dec 1, 2020	modelMulti-agent Reinforcement Learning	—Unverified
Robust Multimodal Image Registration Using Deep Recurrent Reinforcement Learning	Jan 29, 2020	Image RegistrationMedical Image Registration	—Unverified
Robust N-1 secure HV Grid Flexibility Estimation for TSO-DSO coordinated Congestion Management with Deep Reinforcement Learning	Nov 10, 2022	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified
Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning	Mar 27, 2024	Classificationimage-classification	—Unverified
Robust Offline Reinforcement Learning -- Certify the Confidence Interval	Sep 28, 2023	reinforcement-learningReinforcement Learning	—Unverified
Robust Offline Reinforcement Learning for Non-Markovian Decision Processes	Nov 12, 2024	Dataset Distillationreinforcement-learning	—Unverified
Robust Offline Reinforcement Learning from Low-Quality Data	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Robust Offline Reinforcement Learning with Gradient Penalty and Constraint Relaxation	Oct 19, 2022	D4RLMuJoCo	—Unverified
Robust off-policy Reinforcement Learning via Soft Constrained Adversary	Aug 31, 2024	reinforcement-learningReinforcement Learning	—Unverified
Robust Opponent Modeling via Adversarial Ensemble Reinforcement Learning in Asymmetric Imperfect-Information Games	Sep 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Robust Path Selection in Software-defined WANs using Deep Reinforcement Learning	Dec 21, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Policy Learning over Multiple Uncertainty Sets	Feb 14, 2022	Reinforcement Learning (RL)	—Unverified
Robust Policy Learning via Offline Skill Diffusion	Mar 1, 2024	DecoderImitation Learning	—Unverified
Robust Policy Switching for Antifragile Reinforcement Learning for UAV Deconfliction in Adversarial Environments	Jun 26, 2025	Reinforcement Learning (RL)Thompson Sampling	—Unverified
Robust Predictable Control	Sep 7, 2021	Computational EfficiencyDecision Making	—Unverified
Robust Preference Learning for Storytelling via Contrastive Reinforcement Learning	Oct 14, 2022	Contrastive LearningLanguage Modeling	—Unverified
Robust Quadruped Jumping via Deep Reinforcement Learning	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Recovery Controller for a Quadrupedal Robot using Deep Reinforcement Learning	Jan 22, 2019	Deep Reinforcement LearningNavigate	—Unverified

Show:10 25 50

← PrevPage 221 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified