Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–137 of 137 papers

Title	Date	Tasks	Status
A Local Temporal Difference Code for Distributional Reinforcement Learning	Dec 1, 2020	Distributional Reinforcement LearningImputation	—Unverified
An Analysis of Categorical Distributional Reinforcement Learning	Feb 22, 2018	Distributional Reinforcement Learningreinforcement-learning	—Unverified
An Analysis of Quantile Temporal-Difference Learning	Jan 11, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
An introduction to reinforcement learning for neuroscience	Nov 13, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
A Point-Based Algorithm for Distributional Reinforcement Learning in Partially Observable Domains	May 10, 2025	Decision MakingDistributional Reinforcement Learning	—Unverified
Automatic Risk Adaptation in Distributional Reinforcement Learning	Jun 11, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Batch-Constrained Distributional Reinforcement Learning for Session-based Recommendation	Dec 16, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Bayesian Distributional Policy Gradients	Mar 20, 2021	Atari GamesContrastive Learning	—Unverified
Bellman Diffusion: Generative Modeling as Learning a Linear Operator in the Distribution Space	Oct 2, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
Beyond Average Return in Markov Decision Processes	Oct 31, 2023	Distributional Reinforcement Learning	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
Conservative Distributional Reinforcement Learning with Safety Constraints	Jan 18, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Controlling Synthetic Characters in Simulations: A Case for Cognitive Architectures and Sigma	Jan 6, 2021	Distributional Reinforcement LearningUnity	—Unverified
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition	Jul 10, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Deep Distributional Learning with Non-crossing Quantile Network	Apr 11, 2025	Distributional Reinforcement Learningquantile regression	—Unverified
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning for Smart Grids	May 5, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified
Distributional Reinforcement Learning for Efficient Exploration	May 13, 2019	Atari GamesDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning for Risk-Sensitive Policies	Jan 1, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning for mmWave Communications with Intelligent Reflectors on a UAV	Nov 3, 2020	Distributional Reinforcement Learningquantile regression	—Unverified
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes	Mar 1, 2022	Decision MakingDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Monotonic Splines	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Diverse Projection Ensembles for Distributional Reinforcement Learning	Jun 12, 2023	Distributional Reinforcement LearningDiversity	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Exploration with Multi-Sample Target Values for Distributional Reinforcement Learning	Feb 6, 2022	continuous-controlContinuous Control	—Unverified
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation	Feb 20, 2025	Distributional Reinforcement Learning	—Unverified
Flow Models for Unbounded and Geometry-Aware Distributional Reinforcement Learning	May 7, 2025	Distributional Reinforcement Learning	—Unverified
Foundations of Multivariate Distributional Reinforcement Learning	Aug 31, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 3 of 3Next →

No leaderboard results yet.