Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9376–9400 of 15113 papers

Title	Date	Tasks	Status	Hype
An Empirical Study of Representation Learning for Reinforcement Learning in Healthcare	Nov 23, 2020	Open-Ended Question Answeringreinforcement-learning	CodeCode Available	1
Evolutionary Planning in Latent Space	Nov 23, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
COCOI: Contact-aware Online Context Inference for Generalizable Non-planar Pushing	Nov 23, 2020	Contact-rich ManipulationDeep Reinforcement Learning	—Unverified	0
An analysis of Reinforcement Learning applied to Coach task in IEEE Very Small Size Soccer	Nov 23, 2020	Reinforcement Learning (RL)	CodeCode Available	0
Generative Adversarial Simulator	Nov 23, 2020	Data-free Knowledge DistillationKnowledge Distillation	—Unverified	0
Distributed Deep Reinforcement Learning: An Overview	Nov 22, 2020	Deep Reinforcement LearningMulti-Task Learning	—Unverified	0
Reinforcement learning with distance-based incentive/penalty (DIP) updates for highly constrained industrial control systems	Nov 22, 2020	Reinforcement Learning (RL)	—Unverified	0
Policy Teaching in Reinforcement Learning via Environment Poisoning Attacks	Nov 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
On the Convergence of Reinforcement Learning in Nonlinear Continuous State Space Problems	Nov 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Double Meta-Learning for Data Efficient Policy Optimization in Non-Stationary Environments	Nov 21, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Delay Constrained Buffer-Aided Relay Selection in the Internet of Things with Decision-Assisted Reinforcement Learning	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Model-based Reinforcement Learning for Continuous Control with Posterior Sampling	Nov 20, 2020	continuous-controlContinuous Control	CodeCode Available	0
Revisiting Rainbow: Promoting more Insightful and Inclusive Deep Reinforcement Learning Research	Nov 20, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
MRAC-RL: A Framework for On-Line Policy Adaptation Under Parametric Model Uncertainty	Nov 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep reinforcement learning for feedback control in a collective flashing ratchet	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Bridging Scene Understanding and Task Execution with Flexible Simulation Environments	Nov 20, 2020	Graph Generationreinforcement-learning	—Unverified	0
Provable Multi-Objective Reinforcement Learning with Generative Models	Nov 19, 2020	Multi-Objective Reinforcement LearningQ-Learning	—Unverified	0
Online Model Selection for Reinforcement Learning with Function Approximation	Nov 19, 2020	Deep Reinforcement LearningModel Selection	—Unverified	0
Parrot: Data-Driven Behavioral Priors for Reinforcement Learning	Nov 19, 2020	Decision Makingreinforcement-learning	—Unverified	0
Energy Aware Deep Reinforcement Learning Scheduling for Sensors Correlated in Time and Space	Nov 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
FinRL: A Deep Reinforcement Learning Library for Automated Stock Trading in Quantitative Finance	Nov 19, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	3
Inverse Constrained Reinforcement Learning	Nov 19, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Is Independent Learning All You Need in the StarCraft Multi-Agent Challenge?	Nov 18, 2020	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Inverse Reinforcement Learning via Matching of Optimality Profiles	Nov 18, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Experimental Study on Reinforcement Learning-based Control of an Acrobot	Nov 18, 2020	Acrobotreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 376 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified