Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 137 papers

Title	Date	Tasks	Status
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Multi-compartment Neuron and Population Encoding Powered Spiking Neural Network for Deep Distributional Reinforcement Learning	Jan 18, 2023	Atari GamesDistributional Reinforcement Learning	—Unverified
An Analysis of Quantile Temporal-Difference Learning	Jan 11, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Invariance to Quantile Selection in Distributional Continuous Control	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization?	Sep 29, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Normality-Guided Distributional Reinforcement Learning for Continuous Control	Aug 28, 2022	continuous-controlContinuous Control	—Unverified
The Nature of Temporal Difference Errors in Multi-step Distributional Reinforcement Learning	Jul 15, 2022	Distributional Reinforcement Learningquantile regression	—Unverified
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 8 of 14Next →

No leaderboard results yet.