Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2025 of 15113 papers

Title	Date	Tasks	Status	Hype
Sample Efficient Ensemble Learning with Catalyst.RL	Mar 29, 2020	Ensemble Learningreinforcement-learning	CodeCode Available	1
Modeling 3D Shapes by Reinforcement Learning	Mar 27, 2020	Deep Reinforcement LearningImitation Learning	CodeCode Available	1
An empirical investigation of the challenges of real-world reinforcement learning	Mar 24, 2020	continuous-controlContinuous Control	CodeCode Available	1
Evolutionary Population Curriculum for Scaling Multi-Agent Reinforcement Learning	Mar 23, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Using Deep Reinforcement Learning Methods for Autonomous Vessels in 2D Environments	Mar 23, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
FlapAI Bird: Training an Agent to Play Flappy Bird Using Reinforcement Learning Techniques	Mar 21, 2020	Q-Learningreinforcement-learning	CodeCode Available	1
Robust Deep Reinforcement Learning against Adversarial Perturbations on State Observations	Mar 19, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Enhanced POET: Open-Ended Reinforcement Learning through Unbounded Invention of Learning Challenges and their Solutions	Mar 19, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Social Navigation with Human Empowerment driven Deep Reinforcement Learning	Mar 18, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Simultaneous Navigation and Radio Mapping for Cellular-Connected UAV with Deep Reinforcement Learning	Mar 17, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Giving Up Control: Neurons as Reinforcement Learning Agents	Mar 17, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Self-Supervised Discovering of Interpretable Features for Reinforcement Learning	Mar 16, 2020	Atari GamesDecision Making	CodeCode Available	1
PFPN: Continuous Control of Physically Simulated Characters using Particle Filtering Policy Network	Mar 16, 2020	continuous-controlContinuous Control	CodeCode Available	1
DisCor: Corrective Feedback in Reinforcement Learning via Distribution Correction	Mar 16, 2020	Deep Reinforcement LearningMeta-Learning	CodeCode Available	1
Deep Deterministic Portfolio Optimization	Mar 13, 2020	Deep Reinforcement LearningPortfolio Optimization	CodeCode Available	1
Sample Efficient Reinforcement Learning through Learning from Demonstrations in Minecraft	Mar 12, 2020	Deep Reinforcement LearningMinecraft	CodeCode Available	1
On the Robustness of Cooperative Multi-Agent Reinforcement Learning	Mar 8, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic Signal Control	Mar 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Contention Window Optimization in IEEE 802.11ax Networks with Deep Reinforcement Learning	Mar 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Robust Market Making via Adversarial Reinforcement Learning	Mar 3, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Embodied Synaptic Plasticity with Online Reinforcement learning	Mar 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Can Increasing Input Dimensionality Improve Deep Reinforcement Learning?	Mar 3, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
AutoPhase: Juggling HLS Phase Orderings in Random Forests with Deep Reinforcement Learning	Mar 2, 2020	Deep Reinforcement LearningHigh-Level Synthesis	CodeCode Available	1
MVP: Unified Motion and Visual Self-Supervised Learning for Large-Scale Robotic Navigation	Mar 2, 2020	Autonomous DrivingAutonomous Navigation	CodeCode Available	1
PPMC RL Training Algorithm: Rough Terrain Intelligent Robots through Reinforcement Learning	Mar 2, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 81 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified