SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1991–2000 of 15113 papers

Title	Date	Tasks	Status	Hype
Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward Decomposition	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
CURL: Contrastive Unsupervised Representations for Reinforcement Learning	Apr 8, 2020	Atari GamesAtari Games 100k	CodeCode Available	1
An Application of Deep Reinforcement Learning to Algorithmic Trading	Apr 7, 2020	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available	1
MRI Reconstruction with Interpretable Pixel-Wise Operations Using Reinforcement Learning	Apr 3, 2020	compressed sensingDeep Reinforcement Learning	CodeCode Available	1
Learning 2-opt Heuristics for the Traveling Salesman Problem via Deep Reinforcement Learning	Apr 3, 2020	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Action Space Shaping in Deep Reinforcement Learning	Apr 2, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-Task Reinforcement Learning with Soft Modularization	Mar 30, 2020	Meta-LearningMulti-Task Learning	CodeCode Available	1
Agent57: Outperforming the Atari Human Benchmark	Mar 30, 2020	Atari GamesReinforcement Learning	CodeCode Available	1
Deep reinforcement learning for large-scale epidemic control	Mar 30, 2020	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
Ultrasound-Guided Robotic Navigation with Deep Reinforcement Learning	Mar 30, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 200 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified