Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 81–90 of 137 papers

Title	Date	Tasks	Status
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Exploration with Multi-Sample Target Values for Distributional Reinforcement Learning	Feb 6, 2022	continuous-controlContinuous Control	—Unverified
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation	Feb 20, 2025	Distributional Reinforcement Learning	—Unverified
Flow Models for Unbounded and Geometry-Aware Distributional Reinforcement Learning	May 7, 2025	Distributional Reinforcement Learning	—Unverified
Foundations of Multivariate Distributional Reinforcement Learning	Aug 31, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
GAN-powered Deep Distributional Reinforcement Learning for Resource Management in Network Slicing	May 10, 2019	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
A Simulation Environment and Reinforcement Learning Method for Waste Reduction	May 30, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets	Nov 2, 2024	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization?	Sep 29, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 9 of 14Next →

No leaderboard results yet.