Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5476–5500 of 15113 papers

Title	Date	Tasks	Status
Robust Bandwidth Estimation for Real-Time Communication with Offline Reinforcement Learning	Jul 8, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Robust Bayesian optimization with reinforcement learned acquisition functions	Oct 2, 2022	Bayesian Optimizationreinforcement-learning	—Unverified
Robust Constrained Reinforcement Learning	Sep 14, 2022	Adversarial Attackreinforcement-learning	—Unverified
Robust Constrained Reinforcement Learning for Continuous Control with Model Misspecification	Oct 20, 2020	continuous-controlContinuous Control	—Unverified
Robust Data Detection for MIMO Systems with One-Bit ADCs: A Reinforcement Learning Approach	Mar 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Exploring the Noise Resilience of Successor Features and Predecessor Features Algorithms in One and Two-Dimensional Environments	Apr 14, 2023	Decision MakingQ-Learning	—Unverified
Robust Decision Transformer: Tackling Data Corruption in Offline RL via Sequence Modeling	Jul 5, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Robust, Deep, and Reinforcement Learning for Management of Communication and Power Networks	Feb 8, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Robust Deep Reinforcement Learning for Security and Safety in Autonomous Vehicle Systems	May 2, 2018	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Robust Deep Reinforcement Learning for Extractive Legal Summarization	Nov 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Deep Reinforcement Learning with Adversarial Attacks	Dec 11, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Robust Defense Against Extreme Grid Events Using Dual-Policy Reinforcement Learning Agents	Nov 17, 2024	Reinforcement Learning (RL)	—Unverified
Robust Domain Randomised Reinforcement Learning through Peer-to-Peer Distillation	Dec 9, 2020	continuous-controlContinuous Control	—Unverified
Robust Domain Randomization for Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Robust Dual View Deep Agent	Apr 13, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach	Nov 2, 2021	continuous-controlContinuous Control	—Unverified
Robust Entropy-regularized Markov Decision Processes	Dec 31, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified
Robust Gymnasium: A Unified Modular Benchmark for Robust Reinforcement Learning	Feb 27, 2025	reinforcement-learningReinforcement Learning	—Unverified
Robust High-speed Running for Quadruped Robots via Deep Reinforcement Learning	Mar 11, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robustifying a Policy in Multi-Agent RL with Diverse Cooperative Behaviors and Adversarial Style Sampling for Assistive Tasks	Mar 1, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Robustifying Reinforcement Learning Agents via Action Space Adversarial Training	Jul 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robustifying Reinforcement Learning Policies with L_1 Adaptive Control	Jun 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Robust Image Matching By Dynamic Feature Selection	Aug 13, 2020	Decision Makingfeature selection	—Unverified
Robust Imitation via Decision-Time Planning	Jan 1, 2021	Imitation Learningreinforcement-learning	—Unverified
Robust Imitation via Mirror Descent Inverse Reinforcement Learning	Oct 20, 2022	Density EstimationImitation Learning	—Unverified

Show:10 25 50

← PrevPage 220 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified