Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2126–2150 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning with Convex Constraints	Jun 21, 2019	Diversityreinforcement-learning	CodeCode Available	1
Split Q Learning: Reinforcement Learning with Two-Stream Rewards	Jun 21, 2019	Decision MakingQ-Learning	CodeCode Available	1
Unsupervised Learning of Object Keypoints for Perception and Control	Jun 19, 2019	3D Action Recognitionimage-classification	CodeCode Available	1
When to Trust Your Model: Model-Based Policy Optimization	Jun 19, 2019	modelModel-based Reinforcement Learning	CodeCode Available	1
MoËT: Mixture of Expert Trees and its Application to Verifiable Reinforcement Learning	Jun 16, 2019	Game of GoImitation Learning	CodeCode Available	1
When to use parametric models in reinforcement learning?	Jun 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Boosting Soft Actor-Critic: Emphasizing Recent Experience without Forgetting the Past	Jun 10, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Coordinated Exploration via Intrinsic Rewards for Multi-Agent Reinforcement Learning	May 28, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Snooping Attacks on Deep Reinforcement Learning	May 28, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
SQIL: Imitation Learning via Reinforcement Learning with Sparse Rewards	May 27, 2019	Imitation LearningMuJoCo	CodeCode Available	1
Adversarial Policies: Attacking Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Maximum Entropy-Regularized Multi-Goal Reinforcement Learning	May 21, 2019	Multi-Goal Reinforcement LearningOpenAI Gym	CodeCode Available	1
QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning	May 14, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Challenges of Real-World Reinforcement Learning	Apr 29, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Model-free Deep Reinforcement Learning for Urban Autonomous Driving	Apr 20, 2019	Autonomous DrivingDecision Making	CodeCode Available	1
Optimization Methods for Interpretable Differentiable Decision Trees in Reinforcement Learning	Mar 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Learning to Paint With Model-based Deep Reinforcement Learning	Mar 11, 2019	Deep Reinforcement LearningPosition	CodeCode Available	1
Skew-Fit: State-Covering Self-Supervised Reinforcement Learning	Mar 8, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Model Primitive Hierarchical Lifelong Reinforcement Learning	Mar 4, 2019	Hierarchical Reinforcement LearningLifelong learning	CodeCode Available	1
A Cooperative Multi-Agent Reinforcement Learning Framework for Resource Balancing in Complex Logistics Network	Mar 2, 2019	Combinatorial OptimizationManagement	CodeCode Available	1
Verifiably Safe Off-Model Reinforcement Learning	Feb 14, 2019	modelreinforcement-learning	CodeCode Available	1
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity	Feb 14, 2019	continuous-controlContinuous Control	CodeCode Available	1
The StarCraft Multi-Agent Challenge	Feb 11, 2019	BenchmarkingMuJoCo	CodeCode Available	1
Certified Reinforcement Learning with Logic Guidance	Feb 2, 2019	Decision MakingDecision Making Under Uncertainty	CodeCode Available	1
Learning agile and dynamic motor skills for legged robots	Jan 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 86 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified