Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 137 papers

Title	Date	Tasks	Status
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified
Robust Probabilistic Model Checking with Continuous Reward Domains	Feb 6, 2025	Distributional Reinforcement Learningmodel	—Unverified
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Safe Distributional Reinforcement Learning	Feb 26, 2021	Autonomous DrivingDistributional Reinforcement Learning	—Unverified
Sample-based Distributional Policy Gradient	Jan 8, 2020	Distributional Reinforcement LearningOpenAI Gym	—Unverified
Second-Order Bounds for [0,1]-Valued Regression via Betting Loss	Jul 16, 2025	Distributional Reinforcement Learningregression	—Unverified
SENTINEL: Taming Uncertainty with Ensemble-based Distributional Reinforcement Learning	Feb 22, 2021	Decision MakingDistributional Reinforcement Learning	—Unverified
Statistical Efficiency of Distributional Temporal Difference Learning and Freedman's Inequality in Hilbert Spaces	Mar 9, 2024	Distributional Reinforcement Learning	—Unverified
Statistics and Samples in Distributional Reinforcement Learning	Feb 21, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Stochastically Dominant Distributional Reinforcement Learning	May 17, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
The Nature of Temporal Difference Errors in Multi-step Distributional Reinforcement Learning	Jul 15, 2022	Distributional Reinforcement Learningquantile regression	—Unverified
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning	Apr 15, 2017	Atari GamesDistributional Reinforcement Learning	—Unverified
The Statistical Benefits of Quantile Temporal-Difference Learning for Value Estimation	May 28, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement Learning	Mar 3, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
The Benefits of Being Categorical Distributional: Uncertainty-aware Regularized Exploration in Reinforcement Learning	Oct 7, 2021	Atari GamesAttribute	—Unverified
Towards Understanding Distributional Reinforcement Learning: Regularization, Optimization, Acceleration and Sinkhorn Algorithm	Sep 29, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Uncertainty-Aware Transient Stability-Constrained Preventive Redispatch: A Distributional Reinforcement Learning Approach	Feb 14, 2024	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified
Distributional Reinforcement Learning for Efficient Exploration	May 13, 2019	Atari GamesDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning for Risk-Sensitive Policies	Jan 1, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning for mmWave Communications with Intelligent Reflectors on a UAV	Nov 3, 2020	Distributional Reinforcement Learningquantile regression	—Unverified
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes	Mar 1, 2022	Decision MakingDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Monotonic Splines	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Diverse Projection Ensembles for Distributional Reinforcement Learning	Jun 12, 2023	Distributional Reinforcement LearningDiversity	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Exploration with Multi-Sample Target Values for Distributional Reinforcement Learning	Feb 6, 2022	continuous-controlContinuous Control	—Unverified
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation	Feb 20, 2025	Distributional Reinforcement Learning	—Unverified
Flow Models for Unbounded and Geometry-Aware Distributional Reinforcement Learning	May 7, 2025	Distributional Reinforcement Learning	—Unverified
Foundations of Multivariate Distributional Reinforcement Learning	Aug 31, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
GAN-powered Deep Distributional Reinforcement Learning for Resource Management in Network Slicing	May 10, 2019	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
A Simulation Environment and Reinforcement Learning Method for Waste Reduction	May 30, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets	Nov 2, 2024	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization?	Sep 29, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Improving Robustness via Risk Averse Distributional Reinforcement Learning	May 1, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Improving the generalizability and robustness of large-scale traffic signal control	Jun 2, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Interpretable Stochastic Model Predictive Control using Distributional Reinforced Estimation for Quadrotor Tracking Systems	May 14, 2022	Distributional Reinforcement LearningModel Predictive Control	—Unverified
Invariance to Quantile Selection in Distributional Continuous Control	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Is Risk-Sensitive Reinforcement Learning Properly Resolved?	Jul 2, 2023	Distributional Reinforcement LearningManagement	—Unverified
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning	Sep 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Millimeter Wave Communications with an Intelligent Reflector: Performance Optimization and Distributional Reinforcement Learning	Feb 24, 2020	Distributional Reinforcement LearningQ-Learning	—Unverified
Minimizing Safety Interference for Safe and Comfortable Automated Driving with Distributional Reinforcement Learning	Jul 15, 2021	Autonomous VehiclesDistributional Reinforcement Learning	—Unverified
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2021	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.