Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 137 papers

Title	Date	Tasks	Status	Hype
Second-Order Bounds for [0,1]-Valued Regression via Betting Loss	Jul 16, 2025	Distributional Reinforcement Learningregression	—Unverified	0
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition	Jul 10, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
ADDQ: Adaptive Distributional Double Q-Learning	Jun 24, 2025	Distributional Reinforcement LearningMuJoCo	CodeCode Available	0
A Point-Based Algorithm for Distributional Reinforcement Learning in Partially Observable Domains	May 10, 2025	Decision MakingDistributional Reinforcement Learning	—Unverified	0
Flow Models for Unbounded and Geometry-Aware Distributional Reinforcement Learning	May 7, 2025	Distributional Reinforcement Learning	—Unverified	0
Deep Distributional Learning with Non-crossing Quantile Network	Apr 11, 2025	Distributional Reinforcement Learningquantile regression	—Unverified	0
Offline and Distributional Reinforcement Learning for Wireless Communications	Apr 4, 2025	Distributional Reinforcement LearningManagement	—Unverified	0
RIZE: Regularized Imitation Learning via Distributional Reinforcement Learning	Feb 27, 2025	Distributional Reinforcement LearningImitation Learning	CodeCode Available	0
Adaptive Nesterov Accelerated Distributional Deep Hedging for Efficient Volatility Risk Management	Feb 25, 2025	Distributional Reinforcement LearningManagement	—Unverified	0
A Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation	Feb 20, 2025	Distributional Reinforcement Learning	—Unverified	0
Robust Probabilistic Model Checking with Continuous Reward Domains	Feb 6, 2025	Distributional Reinforcement Learningmodel	—Unverified	0
Tackling Uncertainties in Multi-Agent Reinforcement Learning through Integration of Agent Termination Dynamics	Jan 21, 2025	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	0
Risk-averse policies for natural gas futures trading using distributional reinforcement learning	Jan 8, 2025	Distributional Reinforcement Learningenergy trading	—Unverified	0
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning	Jan 3, 2025	Decision MakingDistributional Reinforcement Learning	CodeCode Available	0
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets	Nov 2, 2024	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning	Oct 14, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Bellman Diffusion: Generative Modeling as Learning a Linear Operator in the Distribution Space	Oct 2, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified	0
Offline and Distributional Reinforcement Learning for Radio Resource Management	Sep 25, 2024	Distributional Reinforcement LearningManagement	—Unverified	0
Foundations of Multivariate Distributional Reinforcement Learning	Aug 31, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified	0
EX-DRL: Hedging Against Heavy Losses with EXtreme Distributional Reinforcement Learning	Aug 22, 2024	Distributional Reinforcement Learningquantile regression	CodeCode Available	0
Bellman Unbiasedness: Toward Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation	Jul 31, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
On Policy Evaluation Algorithms in Distributional Reinforcement Learning	Jul 19, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods	Jul 18, 2024	Atari GamesDecision Making	—Unverified	0
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence	May 23, 2024	Distributional Reinforcement LearningPolicy Gradient Methods	—Unverified	0
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics	May 4, 2024	continuous-controlContinuous Control	CodeCode Available	0
Statistical Efficiency of Distributional Temporal Difference Learning and Freedman's Inequality in Hilbert Spaces	Mar 9, 2024	Distributional Reinforcement Learning	—Unverified	0
Provable Risk-Sensitive Distributional Reinforcement Learning with General Function Approximation	Feb 28, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Uncertainty-Aware Transient Stability-Constrained Preventive Redispatch: A Distributional Reinforcement Learning Approach	Feb 14, 2024	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
A Distributional Analogue to the Successor Representation	Feb 13, 2024	Distributional Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Near-Minimax-Optimal Distributional Reinforcement Learning with a Generative Model	Feb 12, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified	0
Echoes of Socratic Doubt: Embracing Uncertainty in Calibrated Evidential Reinforcement Learning	Feb 11, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
Distributional Off-policy Evaluation with Bellman Residual Minimization	Feb 2, 2024	Distributional Reinforcement LearningOff-policy evaluation	CodeCode Available	0
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In Distributional Reinforcement Learning	Jan 4, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified	0
Noise Distribution Decomposition based Multi-Agent Distributional Reinforcement Learning	Dec 12, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Distributional Bellman Operators over Mean Embeddings	Dec 9, 2023	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
An introduction to reinforcement learning for neuroscience	Nov 13, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Beyond Average Return in Markov Decision Processes	Oct 31, 2023	Distributional Reinforcement Learning	—Unverified	0
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion	Oct 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Estimation and Inference in Distributional Reinforcement Learning	Sep 29, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning	Sep 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Value-Distributional Model-Based Reinforcement Learning	Aug 12, 2023	continuous-controlContinuous Control	CodeCode Available	0
Variance Control for Distributional Reinforcement Learning	Jul 30, 2023	Distributional Reinforcement LearningMuJoCo	CodeCode Available	0
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified	0
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning	Jul 4, 2023	Distributional Reinforcement Learningmodel	CodeCode Available	0
Is Risk-Sensitive Reinforcement Learning Properly Resolved?	Jul 2, 2023	Distributional Reinforcement LearningManagement	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

No leaderboard results yet.