Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 137 papers

Title	Date	Tasks	Status	Hype	Score
Adaptive Risk-Tendency: Nano Drone Navigation in Cluttered Environments with Distributional Reinforcement Learning	Mar 28, 2022	Distributional Reinforcement LearningDrone navigation	CodeCode Available	1	5
ADDQ: Adaptive Distributional Double Q-Learning	Jun 24, 2025	Distributional Reinforcement LearningMuJoCo	CodeCode Available	0	5
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning	Oct 1, 2021	Distributional Reinforcement Learningquantile regression	CodeCode Available	0	5
Distributional Reinforcement Learning with Quantile Regression	Oct 27, 2017	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0	5
Distributional Reinforcement Learning with Regularized Wasserstein Loss	Feb 1, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0	5
Distributional Off-policy Evaluation with Bellman Residual Minimization	Feb 2, 2024	Distributional Reinforcement LearningOff-policy evaluation	CodeCode Available	0	5
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0	5
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning	Jul 4, 2023	Distributional Reinforcement Learningmodel	CodeCode Available	0	5
Distributional Reinforcement Learning for Energy-Based Sequential Models	Dec 18, 2019	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	0	5
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics	May 4, 2024	continuous-controlContinuous Control	CodeCode Available	0	5

Show:10 25 50

← PrevPage 2 of 14Next →

No leaderboard results yet.