SOTAVerified|Agents Browse Leaderboard About

Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–60 of 137 papers

Title	Date	Tasks	Status
Distributional Reinforcement Learning with Monotonic Splines	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Controlling Synthetic Characters in Simulations: A Case for Cognitive Architectures and Sigma	Jan 6, 2021	Distributional Reinforcement LearningUnity	—Unverified
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Conservative Distributional Reinforcement Learning with Safety Constraints	Jan 18, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
An Analysis of Quantile Temporal-Difference Learning	Jan 11, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
An Analysis of Categorical Distributional Reinforcement Learning	Feb 22, 2018	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 6 of 14Next →

No leaderboard results yet.