Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 137 papers

Title	Date	Tasks	Status	Hype
The Nature of Temporal Difference Errors in Multi-step Distributional Reinforcement Learning	Jul 15, 2022	Distributional Reinforcement Learningquantile regression	—Unverified	0
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
A Simulation Environment and Reinforcement Learning Method for Waste Reduction	May 30, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Interpretable Stochastic Model Predictive Control using Distributional Reinforced Estimation for Quadrotor Tracking Systems	May 14, 2022	Distributional Reinforcement LearningModel Predictive Control	—Unverified	0
Gamma and Vega Hedging Using Deep Distributional Reinforcement Learning	May 10, 2022	Distributional Reinforcement LearningPosition	CodeCode Available	1
Adaptive Risk-Tendency: Nano Drone Navigation in Cluttered Environments with Distributional Reinforcement Learning	Mar 28, 2022	Distributional Reinforcement LearningDrone navigation	CodeCode Available	1
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes	Mar 1, 2022	Decision MakingDistributional Reinforcement Learning	—Unverified	0
Exploration with Multi-Sample Target Values for Distributional Reinforcement Learning	Feb 6, 2022	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 8 of 14Next →

No leaderboard results yet.