Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Accelerating Reinforcement Learning with Learned Skill Priors	Oct 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Deep Intrinsically Motivated Exploration in Continuous Control	Oct 1, 2022	continuous-controlContinuous Control	CodeCode Available	1
Control-Oriented Model-Based Reinforcement Learning with Implicit Differentiation	Jun 6, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Latent Competition: Learning to Race Using Visual Control Policies in Latent Space	Feb 19, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Actor-Critic Reinforcement Learning for Control with Stability Guarantee	Apr 29, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
A game-theoretic analysis of networked system control for common-pool resource management using multi-agent reinforcement learning	Oct 15, 2020	ManagementMulti-agent Reinforcement Learning	CodeCode Available	1
A Game-Theoretic Approach to Multi-Agent Trust Region Optimization	Jun 12, 2021	Atari GamesMuJoCo	CodeCode Available	1
DeepMind Lab2D	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling	Oct 29, 2018	Collaborative FilteringDecision Making	CodeCode Available	1
Deep Reinforcement Learning based Evasion Generative Adversarial Network for Botnet Detection	Oct 6, 2022	Deep Reinforcement LearningGenerative Adversarial Network	CodeCode Available	1
Deep-Reinforcement-Learning-based Path Planning for Industrial Robots using Distance Sensors as Observation	Jan 14, 2023	Deep Reinforcement LearningIndustrial Robots	CodeCode Available	1
Deep Reinforcement Learning Control of Quantum Cartpoles	Oct 21, 2019	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 1, 2023	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Deep Reinforcement Learning for Active Human Pose Estimation	Jan 7, 2020	3D Human Pose EstimationDeep Reinforcement Learning	CodeCode Available	1
A General Contextualized Rewriting Framework for Text Summarization	Jul 13, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Comparing Deep Reinforcement Learning Algorithms in Two-Echelon Supply Chains	Apr 20, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity	Feb 14, 2019	continuous-controlContinuous Control	CodeCode Available	1
Deep Reinforcement Learning for Entity Alignment	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Deep reinforcement learning for large-scale epidemic control	Mar 30, 2020	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for List-wise Recommendations	Dec 30, 2017	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	1
Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum Learning Study	Apr 27, 2022	Contact-rich ManipulationReinforcement Learning (RL)	CodeCode Available	1
Deep Reinforcement Learning for Process Synthesis	Sep 23, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement learning for real autonomous mobile robot navigation in indoor environments	May 28, 2020	continuous-controlContinuous Control	CodeCode Available	1
Accelerating lifelong reinforcement learning via reshaping rewards	Oct 17, 2021	Lifelong learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 30 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified