Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 137 papers

Title	Date	Tasks	Status
Distributional Reinforcement Learning for Risk-Sensitive Policies	Jan 1, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning for mmWave Communications with Intelligent Reflectors on a UAV	Nov 3, 2020	Distributional Reinforcement Learningquantile regression	—Unverified
Automatic Risk Adaptation in Distributional Reinforcement Learning	Jun 11, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes	Mar 1, 2022	Decision MakingDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning for Smart Grids	May 5, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 5 of 14Next →

No leaderboard results yet.