Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 121–130 of 137 papers

Title	Date	Tasks	Status
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Distributional Bellman Operators over Mean Embeddings	Dec 9, 2023	Atari GamesDeep Reinforcement Learning	CodeCode Available
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning	Jan 3, 2025	Decision MakingDistributional Reinforcement Learning	CodeCode Available
Implicit Quantile Networks for Distributional Reinforcement Learning	Jun 14, 2018	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control	Feb 22, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
ADDQ: Adaptive Distributional Double Q-Learning	Jun 24, 2025	Distributional Reinforcement LearningMuJoCo	CodeCode Available
Echoes of Socratic Doubt: Embracing Uncertainty in Calibrated Evidential Reinforcement Learning	Feb 11, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics	May 4, 2024	continuous-controlContinuous Control	CodeCode Available
Estimating Risk and Uncertainty in Deep Reinforcement Learning	May 23, 2019	Bayesian InferenceDeep Reinforcement Learning	CodeCode Available
Estimation and Inference in Distributional Reinforcement Learning	Sep 29, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 13 of 14Next →

No leaderboard results yet.