Safe Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 306 papers

Title	Date	Tasks	Status
Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation	Apr 30, 2025	Autonomous NavigationSafe Reinforcement Learning	—Unverified
DESTA: A Framework for Safe Reinforcement Learning with Markov Games of Intervention	Oct 27, 2021	OpenAI Gymreinforcement-learning	—Unverified
DIAL: Distribution-Informed Adaptive Learning of Multi-Task Constraints for Safety-Critical Systems	Jan 30, 2025	Autonomous DrivingImitation Learning	—Unverified
Directed Policy Gradient for Safe Reinforcement Learning with Human Advice	Aug 13, 2018	reinforcement-learningReinforcement Learning	—Unverified
Distributionally Safe Reinforcement Learning under Model Uncertainty: A Single-Level Approach by Differentiable Convex Programming	Oct 3, 2023	Safe Reinforcement Learning	—Unverified
Do No Harm: A Counterfactual Approach to Safe Reinforcement Learning	May 19, 2024	counterfactualFriction	—Unverified
Doubly Robust Off-Policy Actor-Critic Algorithms for Reinforcement Learning	Dec 11, 2019	continuous-controlContinuous Control	—Unverified
Dynamic Model Predictive Shielding for Provably Safe Reinforcement Learning	May 22, 2024	reinforcement-learningReinforcement Learning	—Unverified
Efficient Off-Policy Safe Reinforcement Learning Using Trust Region Conditional Value at Risk	Dec 1, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement Learning in Unknown Stochastic Environments	Sep 29, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Enhance Exploration in Safe Reinforcement Learning with Contrastive Representation Learning	Mar 13, 2025	Contrastive LearningRepresentation Learning	—Unverified
Ensuring Safety in Target Pursuit Control: A CBF-Safe Reinforcement Learning Approach	Nov 26, 2024	Collision Avoidancereinforcement-learning	—Unverified
Feasibility-Aware Pessimistic Estimation: Toward Long-Horizon Safety in Offline RL	May 13, 2025	Offline RLSafe Reinforcement Learning	—Unverified
Feasible Policy Iteration for Safe Reinforcement Learning	Apr 18, 2023	reinforcement-learningReinforcement Learning	—Unverified
Flipping-based Policy for Chance-Constrained Markov Decision Processes	Oct 9, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
FOSP: Fine-tuning Offline Safe Policy through World Models	Jul 6, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
From Text to Trajectory: Exploring Complex Constraint Representation and Decomposition in Safe Reinforcement Learning	Dec 12, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Fully Bayesian Recurrent Neural Networks for Safe Reinforcement Learning	Nov 8, 2019	Collision Avoidancereinforcement-learning	—Unverified
GenSafe: A Generalizable Safety Enhancer for Safe Reinforcement Learning Algorithms Based on Reduced Order Markov Decision Process Model	Jun 6, 2024	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Gradient Shaping for Multi-Constraint Safe Reinforcement Learning	Dec 23, 2023	reinforcement-learningReinforcement Learning	—Unverified
Guided Online Distillation: Promoting Safe Reinforcement Learning by Offline Demonstration	Sep 18, 2023	Autonomous DrivingDecision Making	—Unverified
HASARD: A Benchmark for Vision-Based Safe Reinforcement Learning in Embodied Agents	Mar 11, 2025	NavigateReinforcement Learning (RL)	—Unverified
Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation	Mar 15, 2025	Hierarchical Reinforcement LearningMotion Planning	—Unverified
Lagrangian-based online safe reinforcement learning for state-constrained systems	May 22, 2023	reinforcement-learningReinforcement Learning	—Unverified
Implicit Safe Set Algorithm for Provably Safe Reinforcement Learning	May 4, 2024	continuous-controlContinuous Control	—Unverified
Improved Regret Bound for Safe Reinforcement Learning via Tighter Cost Pessimism and Reward Optimism	Oct 14, 2024	Safe Reinforcement Learning	—Unverified
Iterative Reachability Estimation for Safe Reinforcement Learning	Sep 24, 2023	MuJoCoreinforcement-learning	—Unverified
Joint Learning of Policy with Unknown Temporal Constraints for Safe Reinforcement Learning	Apr 30, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning a Shield from Catastrophic Action Effects: Never Repeat the Same Mistake	Feb 19, 2022	Continual LearningSafe Reinforcement Learning	—Unverified
Learning Control Barrier Functions and their application in Reinforcement Learning: A Survey	Apr 22, 2024	Lifelong learningreinforcement-learning	—Unverified
Learning Natural Language Constraints for Safe Reinforcement Learning of Language Agents	Apr 4, 2025	Safe Reinforcement Learning	—Unverified
Learning to Be Cautious	Oct 29, 2021	counterfactualSafe Reinforcement Learning	—Unverified
Learning to explore when mistakes are not allowed	Feb 19, 2025	Safe ExplorationSafe Reinforcement Learning	—Unverified
Learning to Recover for Safe Reinforcement Learning	Sep 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
LMPriors: Pre-Trained Language Models as Task-Specific Priors	Oct 22, 2022	Causal InferenceCommon Sense Reasoning	—Unverified
Long and Short-Term Constraints Driven Safe Reinforcement Learning for Autonomous Driving	Mar 27, 2024	Autonomous DrivingDecision Making	—Unverified
Long-term Safe Reinforcement Learning with Binary Feedback	Jan 8, 2024	reinforcement-learningReinforcement Learning	—Unverified
Lyapunov-based uncertainty-aware safe reinforcement learning	Jul 29, 2021	Autonomous DrivingDecision Making	—Unverified
Make Safe Decisions in Power System: Safe Reinforcement Learning Based Pre-decision Making for Voltage Stability Emergency Control	May 26, 2024	Active LearningDecision Making	—Unverified
E^2CFD: Towards Effective and Efficient Cost Function Design for Safe Reinforcement Learning via Large Language Model	Jul 8, 2024	Language ModelingLanguage Modelling	—Unverified
Penalizing side effects using stepwise relative reachability	Jun 4, 2018	Reinforcement LearningSafe Reinforcement Learning	—Unverified
Meta SAC-Lag: Towards Deployable Safe Reinforcement Learning via MetaGradient-based Hyperparameter Tuning	Aug 15, 2024	Safe ExplorationSafe Reinforcement Learning	—Unverified
Model-Based Safe Reinforcement Learning with Time-Varying State and Control Constraints: An Application to Intelligent Vehicles	Dec 18, 2021	Collision Avoidancecontinuous-control	—Unverified
Modeling Risk in Reinforcement Learning: A Literature Mapping	Dec 8, 2023	Managementreinforcement-learning	—Unverified
Uniformly Safe RL with Objective Suppression for Multi-Constraint Safety-Critical Applications	Feb 23, 2024	Autonomous Drivingreinforcement-learning	—Unverified
Techno-Economic Modeling and Safe Operational Optimization of Multi-Network Constrained Integrated Community Energy Systems	Feb 8, 2024	Safe Reinforcement Learning	—Unverified
Multi-task Safe Reinforcement Learning for Navigating Intersections in Dense Traffic	Feb 19, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Networked Multiagent Safe Reinforcement Learning for Low-carbon Demand Management in Distribution Network	Nov 27, 2023	ManagementSafe Reinforcement Learning	—Unverified
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies	May 22, 2025	Offline RLQ-Learning	—Unverified
On Bellman's principle of optimality and Reinforcement learning for safety-constrained Markov decision process	Feb 25, 2023	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 6 of 7Next →

No leaderboard results yet.