Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7701–7725 of 15113 papers

Title	Date	Tasks	Status	Hype
Tianshou: a Highly Modularized Deep Reinforcement Learning Library	Jul 29, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	3
Non-Markovian Reinforcement Learning using Fractional Dynamics	Jul 29, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
Lyapunov-based uncertainty-aware safe reinforcement learning	Jul 29, 2021	Autonomous DrivingDecision Making	—Unverified	0
Packet Routing with Graph Attention Multi-agent Reinforcement Learning	Jul 28, 2021	Graph AttentionGraph Neural Network	—Unverified	0
Value-Based Reinforcement Learning for Continuous Control Robotic Manipulation in Multi-Task Sparse Reward Settings	Jul 28, 2021	continuous-controlContinuous Control	—Unverified	0
Fully Autonomous Real-World Reinforcement Learning with Applications to Mobile Manipulation	Jul 28, 2021	Continual LearningNavigate	—Unverified	0
A Deep Graph Reinforcement Learning Model for Improving User Experience in Live Video Streaming	Jul 28, 2021	Reinforcement Learning (RL)	—Unverified	0
Finding Failures in High-Fidelity Simulation using Adaptive Stress Testing and the Backward Algorithm	Jul 27, 2021	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for L3 Slice Localization in Sarcopenia Assessment	Jul 27, 2021	Deep Reinforcement LearningPosition	—Unverified	0
Human-Level Reinforcement Learning through Theory-Based Modeling, Exploration, and Planning	Jul 27, 2021	Bayesian InferenceBoard Games	—Unverified	0
Reinforcement Learning with Formal Performance Metrics for Quadcopter Attitude Control under Non-nominal Contexts	Jul 27, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Autonomous Reinforcement Learning via Subgoal Curricula	Jul 27, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Asynchronous Distributed Reinforcement Learning for LQR Control via Zeroth-Order Block Coordinate Descent	Jul 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Playtesting: What is Beyond Personas	Jul 26, 2021	Game DesignReinforcement Learning (RL)	—Unverified	0
Reinforced Imitation Learning by Free Energy Principle	Jul 25, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified	0
DR2L: Surfacing Corner Cases to Robustify Autonomous Driving via Domain Randomization Reinforcement Learning	Jul 25, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Cooperative Exploration for Multi-Agent Deep Reinforcement Learning	Jul 23, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Quadruped Locomotion Policies using Logical Rules	Jul 23, 2021	DiversityReinforcement Learning (RL)	—Unverified	0
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings	Jul 23, 2021	Computational EfficiencyDecision Making	CodeCode Available	1
A reinforcement learning approach to resource allocation in genomic selection	Jul 22, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Accelerating Quadratic Optimization with Reinforcement Learning	Jul 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Deep Reinforcement Learning Approach for Fair Traffic Signal Control	Jul 21, 2021	Deep Reinforcement LearningFairness	—Unverified	0
Demonstration-Guided Reinforcement Learning with Learned Skills	Jul 21, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Bayesian Controller Fusion: Leveraging Control Priors in Deep Reinforcement Learning for Robotics	Jul 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
MarsExplorer: Exploration of Unknown Terrains via Deep Reinforcement Learning and Procedurally Generated Environments	Jul 21, 2021	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	1

Show:10 25 50

← PrevPage 309 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified