Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–60 of 137 papers

Title	Date	Tasks	Status
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning for Smart Grids	May 5, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified
Addressing Inherent Uncertainty: Risk-Sensitive Behavior Generation for Automated Driving using Distributional Reinforcement Learning	Feb 5, 2021	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition	Jul 10, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation	Feb 20, 2025	Distributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 6 of 14Next →

No leaderboard results yet.