SOTAVerified|Agents Browse Leaderboard About

Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 137 papers

Title	Date	Tasks	Status	Score
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Fully Parameterized Quantile Function for Distributional Reinforcement Learning	Nov 5, 2019	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning	May 25, 2023	Distributional Reinforcement LearningOffline RL	CodeCode Available	5
Deep Distributional Learning with Non-crossing Quantile Network	Apr 11, 2025	Distributional Reinforcement Learningquantile regression	—Unverified	0
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition	Jul 10, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
A Point-Based Algorithm for Distributional Reinforcement Learning in Partially Observable Domains	May 10, 2025	Decision MakingDistributional Reinforcement Learning	—Unverified	0
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified	0
An introduction to reinforcement learning for neuroscience	Nov 13, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Controlling Synthetic Characters in Simulations: A Case for Cognitive Architectures and Sigma	Jan 6, 2021	Distributional Reinforcement LearningUnity	—Unverified	0
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 5 of 14Next →

No leaderboard results yet.