Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 137 papers

Title	Date	Tasks	Status
Risk-averse policies for natural gas futures trading using distributional reinforcement learning	Jan 8, 2025	Distributional Reinforcement Learningenergy trading	—Unverified
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified
Robust Probabilistic Model Checking with Continuous Reward Domains	Feb 6, 2025	Distributional Reinforcement Learningmodel	—Unverified
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Safe Distributional Reinforcement Learning	Feb 26, 2021	Autonomous DrivingDistributional Reinforcement Learning	—Unverified
Sample-based Distributional Policy Gradient	Jan 8, 2020	Distributional Reinforcement LearningOpenAI Gym	—Unverified
Second-Order Bounds for [0,1]-Valued Regression via Betting Loss	Jul 16, 2025	Distributional Reinforcement Learningregression	—Unverified
Bellman Unbiasedness: Toward Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation	Jul 31, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Statistical Efficiency of Distributional Temporal Difference Learning and Freedman's Inequality in Hilbert Spaces	Mar 9, 2024	Distributional Reinforcement Learning	—Unverified
Statistics and Samples in Distributional Reinforcement Learning	Feb 21, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Stochastically Dominant Distributional Reinforcement Learning	May 17, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
The Nature of Temporal Difference Errors in Multi-step Distributional Reinforcement Learning	Jul 15, 2022	Distributional Reinforcement Learningquantile regression	—Unverified
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning	Apr 15, 2017	Atari GamesDistributional Reinforcement Learning	—Unverified
The Statistical Benefits of Quantile Temporal-Difference Learning for Value Estimation	May 28, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement Learning	Mar 3, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
The Benefits of Being Categorical Distributional: Uncertainty-aware Regularized Exploration in Reinforcement Learning	Oct 7, 2021	Atari GamesAttribute	—Unverified
Towards Understanding Distributional Reinforcement Learning: Regularization, Optimization, Acceleration and Sinkhorn Algorithm	Sep 29, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Uncertainty-Aware Transient Stability-Constrained Preventive Redispatch: A Distributional Reinforcement Learning Approach	Feb 14, 2024	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
SENTINEL: Taming Uncertainty with Ensemble-based Distributional Reinforcement Learning	Feb 22, 2021	Decision MakingDistributional Reinforcement Learning	—Unverified
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning	Oct 14, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Nesterov Accelerated Distributional Deep Hedging for Efficient Volatility Risk Management	Feb 25, 2025	Distributional Reinforcement LearningManagement	—Unverified
Addressing Inherent Uncertainty: Risk-Sensitive Behavior Generation for Automated Driving using Distributional Reinforcement Learning	Feb 5, 2021	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Distributional Perspective on Actor-Critic Framework	Jan 1, 2021	Distributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 4 of 6Next →

No leaderboard results yet.