Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5201–5250 of 15113 papers

Title	Date	Tasks	Status
Hypernetwork Dismantling via Deep Reinforcement Learning	Apr 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hypernetworks for Zero-shot Transfer in Reinforcement Learning	Nov 28, 2022	continuous-controlContinuous Control	—Unverified
Hyper-parameter Optimisation of Gaussian Process Reinforcement Learning for Statistical Dialogue Management	Sep 1, 2015	Dialogue ManagementManagement	—Unverified
Hyper-parameter optimization based on soft actor critic and hierarchical mixture regularization	Dec 8, 2021	Bayesian Optimizationreinforcement-learning	—Unverified
Hyperparameter Optimization for Multi-Objective Reinforcement Learning	Oct 25, 2023	Hyperparameter OptimizationMulti-Objective Reinforcement Learning	—Unverified
Hyperparameter Selection for Offline Reinforcement Learning	Jul 17, 2020	Offline RLreinforcement-learning	—Unverified
Hyperparameters in Reinforcement Learning and How To Tune Them	Jun 2, 2023	AutoMLDeep Reinforcement Learning	—Unverified
Hyperparameter Tuning for Deep Reinforcement Learning Applications	Jan 26, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Hyperspace Neighbor Penetration Approach to Dynamic Programming for Model-Based Reinforcement Learning Problems with Slowly Changing Variables in A Continuous State Space	Jun 10, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Hyperspherical Normalization for Scalable Deep Reinforcement Learning	Feb 21, 2025	continuous-controlContinuous Control	—Unverified
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified
IA-MARL: Imputation Assisted Multi-Agent Reinforcement Learning for Missing Training Data	Sep 29, 2021	ImputationMulti-agent Reinforcement Learning	—Unverified
I am Robot: Neuromuscular Reinforcement Learning to Actuate Human Limbs through Functional Electrical Stimulation	Mar 9, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Identifiability in inverse reinforcement learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Identifying Coordination in a Cognitive Radar Network -- A Multi-Objective Inverse Reinforcement Learning Approach	Nov 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Identifying Critical States by the Action-Based Variance of Expected Return	Aug 26, 2020	Reinforcement Learning (RL)	—Unverified
Identifying Decision Points for Safe and Interpretable Reinforcement Learning in Hypotension Treatment	Jan 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Identifying Reasoning Flaws in Planning-Based RL Using Tree Explanations	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
IGO-QNN: Quantum Neural Network Architecture for Inductive Grover Oracularization	May 25, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
ILAEDA: An Imitation Learning Based Approach for Automatic Exploratory Data Analysis	Oct 15, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
IL-flOw: Imitation Learning from Observation using Normalizing Flows	May 19, 2022	continuous-controlContinuous Control	—Unverified
Illuminating Spaces: Deep Reinforcement Learning and Laser-Wall Partitioning for Architectural Layout Generation	Feb 6, 2025	Deep Reinforcement LearningLayout Design	—Unverified
Illuminating the Three Dogmas of Reinforcement Learning under Evolutionary Light	Jul 15, 2025	Reinforcement Learning (RL)	—Unverified
Image-Based Deep Reinforcement Learning with Intrinsically Motivated Stimuli: On the Execution of Complex Robotic Tasks	Jul 31, 2024	continuous-controlContinuous Control	—Unverified
Image Captioning Based on a Hierarchical Attention Mechanism and Policy Gradient Optimization	Nov 13, 2018	Generative Adversarial NetworkImage Captioning	—Unverified
Image Captioning based on Deep Reinforcement Learning	Sep 13, 2018	Deep Reinforcement LearningImage Captioning	—Unverified
Image Deraining via Self-supervised Reinforcement Learning	Mar 27, 2024	DenoisingDictionary Learning	—Unverified
Image-Guided Navigation of a Robotic Ultrasound Probe for Autonomous Spinal Sonography Using a Shadow-aware Dual-Agent Framework	Nov 3, 2021	AnatomyDecision Making	—Unverified
Image quality assessment for machine learning tasks using meta-reinforcement learning	Mar 27, 2022	BIG-bench Machine Learningimage-classification	—Unverified
Image Synthesis for Data Augmentation in Medical CT using Deep Reinforcement Learning	Mar 18, 2021	Data AugmentationDeep Reinforcement Learning	—Unverified
Imagination-Augmented Hierarchical Reinforcement Learning for Safe and Interactive Autonomous Driving in Urban Environments	Nov 17, 2023	Autonomous DrivingHierarchical Reinforcement Learning	—Unverified
Imagined Value Gradients: Model-Based Policy Optimization with Transferable Latent Dynamics Models	Oct 9, 2019	Model-based Reinforcement LearningReinforcement Learning	—Unverified
Imagine Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Imitate then Transcend: Multi-Agent Optimal Execution with Dual-Window Denoise PPO	Jun 21, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified
Imitating, Fast and Slow: Robust learning from demonstrations via decision-time planning	Apr 7, 2022	Imitation Learningreinforcement-learning	—Unverified
Imitating Opponent to Win: Adversarial Policy Imitation Learning in Two-player Competitive Games	Oct 30, 2022	Deep Reinforcement LearningImitation Learning	—Unverified
Imitating Past Successes can be Very Suboptimal	Jun 7, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified
SPOC: Imitating Shortest Paths in Simulation Enables Effective Navigation and Manipulation in the Real World	Dec 5, 2023	BenchmarkingDiversity	—Unverified
Imitation Bootstrapped Reinforcement Learning	Nov 3, 2023	Continuous ControlImitation Learning	—Unverified
Imitation Is Not Enough: Robustifying Imitation with Reinforcement Learning for Challenging Driving Scenarios	Dec 21, 2022	Autonomous DrivingImitation Learning	—Unverified
Forward and inverse reinforcement learning sharing network weights and hyperparameters	Aug 17, 2020	Imitation LearningMuJoCo	—Unverified
Imitation Learning for Human Pose Prediction	Sep 8, 2019	Deep Reinforcement LearningHuman Pose Forecasting	—Unverified
Imitation Learning with Concurrent Actions in 3D Games	Mar 14, 2018	Deep Reinforcement LearningImitation Learning	—Unverified
Imitation-Projected Programmatic Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified
Imitation with Neural Density Models	Oct 19, 2020	Density EstimationImitation Learning	—Unverified
IMM: An Imitative Reinforcement Learning Approach with Predictive Representation Learning for Automatic Market Making	Aug 17, 2023	Decision MakingImitation Learning	—Unverified
Imminent Collision Mitigation with Reinforcement Learning and Vision	Jan 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
IMPACT: Importance Weighted Asynchronous Architectures with Clipped Target Networks	Nov 30, 2019	continuous-controlContinuous Control	—Unverified
Impact of Price Inflation on Algorithmic Collusion Through Reinforcement Learning Agents	Apr 5, 2025	Reinforcement Learning (RL)	—Unverified
Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot	Apr 23, 2024	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 105 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified