Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4276–4300 of 15113 papers

Title	Date	Tasks	Status	Score
TreeC: a method to generate interpretable energy management systems using a metaheuristic algorithm	Apr 17, 2023	energy managementManagement	CodeCode Available	5
TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning	Oct 31, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Online Baum-Welch algorithm for Hierarchical Imitation Learning	Mar 22, 2021	Hierarchical Reinforcement LearningImitation Learning	CodeCode Available	5
Trial without Error: Towards Safe Reinforcement Learning via Human Intervention	Jul 17, 2017	Atari Gamesreinforcement-learning	CodeCode Available	5
Safe Exploration Method for Reinforcement Learning under Existence of Disturbance	Sep 30, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
TripleTree: A Versatile Interpretable Representation of Black Box Agents and their Environments	Sep 10, 2020	Deep Reinforcement LearningExplainable artificial intelligence	CodeCode Available	5
TrojDRL: Trojan Attacks on Deep Reinforcement Learning Agents	Mar 1, 2019	Data PoisoningDeep Reinforcement Learning	CodeCode Available	5
MORE-3S:Multimodal-based Offline Reinforcement Learning with Shared Semantic Spaces	Feb 20, 2024	Decision MakingOffline RL	CodeCode Available	5
Reinforcement and Imitation Learning for Diverse Visuomotor Skills	Feb 26, 2018	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
Meta-Reinforcement Learning by Tracking Task Non-stationarity	May 18, 2021	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	5
Trust, but verify: model-based exploration in sparse reward environments	Jan 1, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5
SafeLife 1.0: Exploring Side Effects in Complex Environments	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Trust Region-Guided Proximal Policy Optimization	Jan 29, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
Trust-Region Twisted Policy Improvement	Apr 8, 2025	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control	Nov 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control	Feb 22, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	5
Safe Model-based Reinforcement Learning with Stability Guarantees	May 23, 2017	modelModel-based Reinforcement Learning	CodeCode Available	5
Online Cyber-Attack Detection in Smart Grid: A Reinforcement Learning Approach	Sep 14, 2018	Anomaly DetectionCyber Attack Detection	CodeCode Available	5
Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning	Feb 25, 2025	BenchmarkingReinforcement Learning (RL)	CodeCode Available	5
Reinforcement Knowledge Graph Reasoning for Explainable Recommendation	Jun 12, 2019	Causal InferenceDecision Making	CodeCode Available	5
PIMbot: Policy and Incentive Manipulation for Multi-Robot Reinforcement Learning in Social Dilemmas	Jul 29, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Reinforcement Learning	May 29, 2020	Autonomous VehiclesBoard Games	CodeCode Available	5
Natural Question Generation with Reinforcement Learning Based Graph-to-Sequence Model	Oct 19, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available	5
PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos	Feb 4, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5
Constrained Policy Improvement for Safe and Efficient Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 172 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified