Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3125 of 15113 papers

Title	Date	Tasks	Status
Overcoming Catastrophic Interference in Online Reinforcement Learning with Dynamic Self-Organizing Maps	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adversarial Deep Reinforcement Learning based Adaptive Moving Target Defense	Nov 27, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Deep Reinforcement Learning-Based Adaptive IRS Control with Limited Feedback Codebooks	May 7, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Survey of Knowledge-based Sequential Decision Making under Uncertainty	Aug 19, 2020	Decision MakingDecision Making Under Uncertainty	—Unverified
A Survey of Inverse Reinforcement Learning: Challenges, Methods and Progress	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
AdaPool: A Diurnal-Adaptive Fleet Management Framework using Model-Free Deep Reinforcement Learning and Change Point Detection	Apr 1, 2021	Change Point DetectionDeep Reinforcement Learning	—Unverified
A Survey of In-Context Reinforcement Learning	Feb 11, 2025	In-Context Reinforcement Learningreinforcement-learning	—Unverified
A Survey of Imitation Learning: Algorithms, Recent Developments, and Challenges	Sep 5, 2023	Autonomous DrivingImitation Learning	—Unverified
Cross Learning in Deep Q-Networks	Sep 29, 2020	Q-Learningreinforcement-learning	—Unverified
Crossing the Human-Robot Embodiment Gap with Sim-to-Real RL using One Human Demonstration	Apr 17, 2025	Data AugmentationHuman-Object Interaction Detection	—Unverified
Deep Reinforcement Learning Based Optimization for IRS Based UAV-NOMA Downlink Networks	Jun 17, 2021	Deep Reinforcement LearningPosition	—Unverified
Cross-Embodiment Dexterous Grasping with Reinforcement Learning	Oct 3, 2024	reinforcement-learningReinforcement Learning	—Unverified
A Survey of Zero-shot Generalisation in Deep Reinforcement Learning	Nov 18, 2021	Deep Reinforcement LearningOffline RL	—Unverified
Cross-Domain Transfer via Semantic Skill Imitation	Dec 14, 2022	Reinforcement Learning (RL)Robot Manipulation	—Unverified
Cross-Domain Transfer in Reinforcement Learning using Target Apprentice	Jan 22, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Survey of Forex and Stock Price Prediction Using Deep Learning	Mar 13, 2021	Deep Learningreinforcement-learning	—Unverified
A Survey of Exploration Methods in Reinforcement Learning	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Acceleration of Actor-Critic Deep Reinforcement Learning for Visual Grasping in Clutter by State Representation Learning Based on Disentanglement of a Raw Input Image	Feb 27, 2020	Deep Reinforcement LearningDisentanglement	—Unverified
CrossNorm: On Normalization for Off-Policy Reinforcement Learning	Sep 25, 2019	MuJoCoreinforcement-learning	—Unverified
Cross-State Self-Constraint for Feature Generalization in Deep Reinforcement Learning	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A survey of Monte Carlo methods for noisy and costly densities with application to reinforcement learning and ABC	Aug 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Agent with Tangent-based Formulation and Anatomical Perception for Standard Plane Localization in 3D Ultrasound	Jul 1, 2022	AnatomyReinforcement Learning (RL)	—Unverified
Cross-Domain Perceptual Reward Functions	May 25, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Crowd-PrefRL: Preference-Based Reward Learning from Crowds	Jan 17, 2024	Reinforcement Learning (RL)	—Unverified
A Survey of Explainable Reinforcement Learning	Feb 17, 2022	Decision Makingreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 125 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified