Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 137 papers

Title	Date	Tasks	Status
Invariance to Quantile Selection in Distributional Continuous Control	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Is Risk-Sensitive Reinforcement Learning Properly Resolved?	Jul 2, 2023	Distributional Reinforcement LearningManagement	—Unverified
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning	Sep 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Millimeter Wave Communications with an Intelligent Reflector: Performance Optimization and Distributional Reinforcement Learning	Feb 24, 2020	Distributional Reinforcement LearningQ-Learning	—Unverified
Minimizing Safety Interference for Safe and Comfortable Automated Driving with Distributional Reinforcement Learning	Jul 15, 2021	Autonomous VehiclesDistributional Reinforcement Learning	—Unverified
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2021	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified
Multi-compartment Neuron and Population Encoding Powered Spiking Neural Network for Deep Distributional Reinforcement Learning	Jan 18, 2023	Atari GamesDistributional Reinforcement Learning	—Unverified
Near-Minimax-Optimal Distributional Reinforcement Learning with a Generative Model	Feb 12, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Noise Distribution Decomposition based Multi-Agent Distributional Reinforcement Learning	Dec 12, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Non-Crossing Quantile Regression for Distributional Reinforcement Learning	Dec 1, 2020	Atari GamesDistributional Reinforcement Learning	—Unverified
Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning	May 14, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Nonlinear Distributional Gradient Temporal-Difference Learning	May 20, 2018	Distributional Reinforcement LearningReinforcement Learning	—Unverified
Normality-Guided Distributional Reinforcement Learning for Continuous Control	Aug 28, 2022	continuous-controlContinuous Control	—Unverified
Offline and Distributional Reinforcement Learning for Radio Resource Management	Sep 25, 2024	Distributional Reinforcement LearningManagement	—Unverified
Offline and Distributional Reinforcement Learning for Wireless Communications	Apr 4, 2025	Distributional Reinforcement LearningManagement	—Unverified
One-Step Distributional Reinforcement Learning	Apr 27, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
On Policy Evaluation Algorithms in Distributional Reinforcement Learning	Jul 19, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
On solutions of the distributional Bellman equation	Jan 31, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm	Jun 11, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods	Jul 18, 2024	Atari GamesDecision Making	—Unverified
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion	Oct 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Policy Evaluation in Distributional LQR	Mar 23, 2023	Distributional Reinforcement Learning	—Unverified
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence	May 23, 2024	Distributional Reinforcement LearningPolicy Gradient Methods	—Unverified
Provable Risk-Sensitive Distributional Reinforcement Learning with General Function Approximation	Feb 28, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 3 of 6Next →

No leaderboard results yet.