Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5651–5675 of 15113 papers

Title	Date	Tasks	Status
Safety aware model-based reinforcement learning for optimal control of a class of output-feedback nonlinear systems	Oct 1, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Safety-Aware Multi-Agent Apprenticeship Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning	—Unverified
Safe Autonomous Racing via Approximate Reachability on Ego-vision	Oct 14, 2021	Autonomous DrivingAutonomous Racing	—Unverified
Safety-Aware Reinforcement Learning for Electric Vehicle Charging Station Management in Distribution Network	Mar 20, 2024	ManagementReinforcement Learning (RL)	—Unverified
Safety-Aware Reinforcement Learning for Control via Risk-Sensitive Action-Value Iteration and Quantile Regression	Jun 8, 2025	quantile regressionReinforcement Learning (RL)	—Unverified
Safety Aware Reinforcement Learning (SARL)	Oct 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Safety-Aware Task Composition for Discrete and Continuous Reinforcement Learning	Jun 29, 2023	reinforcement-learningReinforcement Learning	—Unverified
Safety Correction from Baseline: Towards the Risk-aware Policy in Robotics via Dual-agent Reinforcement Learning	Dec 14, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Safety-Enhanced Self-Learning for Optimal Power Converter Control	Dec 7, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Safety Enhancement for Deep Reinforcement Learning in Autonomous Separation Assurance	May 5, 2021	Data AugmentationDeep Reinforcement Learning	—Unverified
Safety Filtering for Reinforcement Learning-based Adaptive Cruise Control	Jan 2, 2023	reinforcement-learningReinforcement Learning	—Unverified
Safety-guaranteed Reinforcement Learning based on Multi-class Support Vector Machine	Jun 12, 2020	Q-Learningreinforcement-learning	—Unverified
Safety-Guided Deep Reinforcement Learning via Online Gaussian Process Estimation	Mar 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safety-Oriented Pruning and Interpretation of Reinforcement Learning Policies	Sep 16, 2024	reinforcement-learningReinforcement Learning	—Unverified
Safety through Permissibility: Shield Construction for Fast and Safe Reinforcement Learning	May 29, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Black-Box Safety Validation of Autonomous Systems: A Multi-Fidelity Reinforcement Learning Approach	Mar 7, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Safety Verification of Model Based Reinforcement Learning Controllers	Oct 21, 2020	Autonomous Drivingmodel	—Unverified
SaFormer: A Conditional Sequence Modeling Approach to Offline Safe Reinforcement Learning	Jan 28, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
SA-IGA: A Multiagent Reinforcement Learning Method Towards Socially Optimal Outcomes	Mar 8, 2018	Q-Learningreinforcement-learning	—Unverified
SAINT-ACC: Safety-Aware Intelligent Adaptive Cruise Control for Autonomous Vehicles Using Deep Reinforcement Learning	Mar 6, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Saliency-based Sequential Image Attention with Multiset Prediction	Nov 14, 2017	ClassificationGeneral Classification	—Unverified
SaLinA: Sequential Learning of Agents	Oct 15, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
SAMG: State-Action-Aware Offline-to-Online Reinforcement Learning with Offline Model Guidance	Oct 24, 2024	D4RLreinforcement-learning	—Unverified
Sample and Oracle Efficient Reinforcement Learning for MDPs with Linearly-Realizable Value Functions	Sep 7, 2024	Reinforcement Learning (RL)	—Unverified
Sample-based Distributional Policy Gradient	Jan 8, 2020	Distributional Reinforcement LearningOpenAI Gym	—Unverified

Show:10 25 50

← PrevPage 227 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified