Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5201–5225 of 15113 papers

Title	Date	Tasks	Status
Hypernetwork Dismantling via Deep Reinforcement Learning	Apr 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hypernetworks for Zero-shot Transfer in Reinforcement Learning	Nov 28, 2022	continuous-controlContinuous Control	—Unverified
Hyper-parameter Optimisation of Gaussian Process Reinforcement Learning for Statistical Dialogue Management	Sep 1, 2015	Dialogue ManagementManagement	—Unverified
Hyper-parameter optimization based on soft actor critic and hierarchical mixture regularization	Dec 8, 2021	Bayesian Optimizationreinforcement-learning	—Unverified
Hyperparameter Optimization for Multi-Objective Reinforcement Learning	Oct 25, 2023	Hyperparameter OptimizationMulti-Objective Reinforcement Learning	—Unverified
Hyperparameter Selection for Offline Reinforcement Learning	Jul 17, 2020	Offline RLreinforcement-learning	—Unverified
Hyperparameters in Reinforcement Learning and How To Tune Them	Jun 2, 2023	AutoMLDeep Reinforcement Learning	—Unverified
Hyperparameter Tuning for Deep Reinforcement Learning Applications	Jan 26, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Hyperspace Neighbor Penetration Approach to Dynamic Programming for Model-Based Reinforcement Learning Problems with Slowly Changing Variables in A Continuous State Space	Jun 10, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Hyperspherical Normalization for Scalable Deep Reinforcement Learning	Feb 21, 2025	continuous-controlContinuous Control	—Unverified
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified
IA-MARL: Imputation Assisted Multi-Agent Reinforcement Learning for Missing Training Data	Sep 29, 2021	ImputationMulti-agent Reinforcement Learning	—Unverified
I am Robot: Neuromuscular Reinforcement Learning to Actuate Human Limbs through Functional Electrical Stimulation	Mar 9, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Identifiability in inverse reinforcement learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Identifying Coordination in a Cognitive Radar Network -- A Multi-Objective Inverse Reinforcement Learning Approach	Nov 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Identifying Critical States by the Action-Based Variance of Expected Return	Aug 26, 2020	Reinforcement Learning (RL)	—Unverified
Identifying Decision Points for Safe and Interpretable Reinforcement Learning in Hypotension Treatment	Jan 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Identifying Reasoning Flaws in Planning-Based RL Using Tree Explanations	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
IGO-QNN: Quantum Neural Network Architecture for Inductive Grover Oracularization	May 25, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
ILAEDA: An Imitation Learning Based Approach for Automatic Exploratory Data Analysis	Oct 15, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
IL-flOw: Imitation Learning from Observation using Normalizing Flows	May 19, 2022	continuous-controlContinuous Control	—Unverified
Illuminating Spaces: Deep Reinforcement Learning and Laser-Wall Partitioning for Architectural Layout Generation	Feb 6, 2025	Deep Reinforcement LearningLayout Design	—Unverified
Illuminating the Three Dogmas of Reinforcement Learning under Evolutionary Light	Jul 15, 2025	Reinforcement Learning (RL)	—Unverified
Image-Based Deep Reinforcement Learning with Intrinsically Motivated Stimuli: On the Execution of Complex Robotic Tasks	Jul 31, 2024	continuous-controlContinuous Control	—Unverified
Image Captioning Based on a Hierarchical Attention Mechanism and Policy Gradient Optimization	Nov 13, 2018	Generative Adversarial NetworkImage Captioning	—Unverified

Show:10 25 50

← PrevPage 209 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified