Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–137 of 137 papers

Title	Date	Tasks	Status
Statistics and Samples in Distributional Reinforcement Learning	Feb 21, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
QUOTA: The Quantile Option Architecture for Reinforcement Learning	Nov 5, 2018	Decision MakingDistributional Reinforcement Learning	CodeCode Available
Implicit Quantile Networks for Distributional Reinforcement Learning	Jun 14, 2018	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Nonlinear Distributional Gradient Temporal-Difference Learning	May 20, 2018	Distributional Reinforcement LearningReinforcement Learning	—Unverified
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
An Analysis of Categorical Distributional Reinforcement Learning	Feb 22, 2018	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Quantile Regression	Oct 27, 2017	Atari GamesDistributional Reinforcement Learning	CodeCode Available
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning	Apr 15, 2017	Atari GamesDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 6 of 6Next →

No leaderboard results yet.