Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4326–4350 of 15113 papers

Title	Date	Tasks	Status	Score
Safe Reinforcement Learning via Probabilistic Logic Shields	Mar 6, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Uncertainty-driven Trajectory Truncation for Data Augmentation in Offline Reinforcement Learning	Apr 10, 2023	D4RLData Augmentation	CodeCode Available	5
Safe Reinforcement Learning via Shielding	Aug 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Mo' States Mo' Problems: Emergency Stop Mechanisms from Observation	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Online Learning in Iterated Prisoner's Dilemma to Mimic Human Behavior	Jun 9, 2020	Multi-Armed Banditsreinforcement-learning	CodeCode Available	5
Reinforcement Learning Approach for Mapping Applications to Dataflow-Based Coarse-Grained Reconfigurable Array	May 26, 2022	Graph AttentionGraph Neural Network	CodeCode Available	5
Uncovering Instabilities in Variational-Quantum Deep Q-Networks	Feb 10, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Markov Abstractions for PAC Reinforcement Learning in Non-Markov Decision Processes	Apr 29, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Understanding Adversarial Attacks on Observations in Deep Reinforcement Learning	Jun 30, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	5
Planning Multiple Epidemic Interventions with Reinforcement Learning	Jan 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Planning the path with Reinforcement Learning: Optimal Robot Motion Planning in RoboCup Small Size League Environments	Apr 23, 2024	Motion PlanningReinforcement Learning (RL)	CodeCode Available	5
Planning to Learn: A Novel Algorithm for Active Learning during Model-Based Planning	Aug 15, 2023	Active Learningcounterfactual	CodeCode Available	5
Understanding Curriculum Learning in Policy Optimization for Online Combinatorial Optimization	Feb 11, 2022	Combinatorial OptimizationReinforcement Learning (RL)	CodeCode Available	5
Safe Reinforcement Learning with Scene Decomposition for Navigating Complex Urban Environments	Apr 25, 2019	Decision MakingNavigate	CodeCode Available	5
Maximum Reward Formulation In Reinforcement Learning	Oct 8, 2020	Drug Discoveryreinforcement-learning	CodeCode Available	5
Understanding Game-Playing Agents with Natural Language Annotations	Apr 15, 2022	Imitation LearningReinforcement Learning (RL)	CodeCode Available	5
Safer Reinforcement Learning through Transferable Instinct Networks	Jul 14, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Understanding Multi-Step Deep Reinforcement Learning: A Systematic Study of the DQN Target	Jan 22, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Planning with Goal-Conditioned Policies	Nov 19, 2019	Decision Makingreinforcement-learning	CodeCode Available	5
Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning	May 4, 2018	Collision AvoidanceDecision Making	CodeCode Available	5
Understanding the Evolution of Linear Regions in Deep Reinforcement Learning	Oct 24, 2022	continuous-controlContinuous Control	CodeCode Available	5
Understanding the impact of entropy on policy optimization	Nov 27, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
MazeBase: A Sandbox for Learning from Games	Nov 23, 2015	NegationReinforcement Learning	CodeCode Available	5
Reinforcement Learning Assisted Recursive QAOA	Jul 13, 2022	Combinatorial Optimizationreinforcement-learning	CodeCode Available	5
Reinforcement Learning -based Adaptation and Scheduling Methods for Multi-source DASH	Jul 25, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 174 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified