Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 137 papers

Title	Date	Tasks	Status
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion	Oct 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Estimation and Inference in Distributional Reinforcement Learning	Sep 29, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning	Sep 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Value-Distributional Model-Based Reinforcement Learning	Aug 12, 2023	continuous-controlContinuous Control	CodeCode Available
Variance Control for Distributional Reinforcement Learning	Jul 30, 2023	Distributional Reinforcement LearningMuJoCo	CodeCode Available
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning	Jul 4, 2023	Distributional Reinforcement Learningmodel	CodeCode Available
Is Risk-Sensitive Reinforcement Learning Properly Resolved?	Jul 2, 2023	Distributional Reinforcement LearningManagement	—Unverified
Diverse Projection Ensembles for Distributional Reinforcement Learning	Jun 12, 2023	Distributional Reinforcement LearningDiversity	—Unverified
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm	Jun 11, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
Improving the generalizability and robustness of large-scale traffic signal control	Jun 2, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
The Statistical Benefits of Quantile Temporal-Difference Learning for Value Estimation	May 28, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning	May 25, 2023	Distributional Reinforcement LearningOffline RL	CodeCode Available
One-Step Distributional Reinforcement Learning	Apr 27, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Policy Evaluation in Distributional LQR	Mar 23, 2023	Distributional Reinforcement Learning	—Unverified
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement Learning	Mar 3, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control	Feb 22, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Multi-compartment Neuron and Population Encoding Powered Spiking Neural Network for Deep Distributional Reinforcement Learning	Jan 18, 2023	Atari GamesDistributional Reinforcement Learning	—Unverified
An Analysis of Quantile Temporal-Difference Learning	Jan 11, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Invariance to Quantile Selection in Distributional Continuous Control	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization?	Sep 29, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Normality-Guided Distributional Reinforcement Learning for Continuous Control	Aug 28, 2022	continuous-controlContinuous Control	—Unverified
The Nature of Temporal Difference Errors in Multi-step Distributional Reinforcement Learning	Jul 15, 2022	Distributional Reinforcement Learningquantile regression	—Unverified
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available
A Simulation Environment and Reinforcement Learning Method for Waste Reduction	May 30, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Interpretable Stochastic Model Predictive Control using Distributional Reinforced Estimation for Quadrotor Tracking Systems	May 14, 2022	Distributional Reinforcement LearningModel Predictive Control	—Unverified
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes	Mar 1, 2022	Decision MakingDistributional Reinforcement Learning	—Unverified
Exploration with Multi-Sample Target Values for Distributional Reinforcement Learning	Feb 6, 2022	continuous-controlContinuous Control	—Unverified
Distributional Reinforcement Learning with Regularized Wasserstein Loss	Feb 1, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available
On solutions of the distributional Bellman equation	Jan 31, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Conservative Distributional Reinforcement Learning with Safety Constraints	Jan 18, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified
Conjugated Discrete Distributions for Distributional Reinforcement Learning	Dec 14, 2021	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Two steps to risk sensitivity	Nov 12, 2021	Decision MakingDistributional Reinforcement Learning	CodeCode Available
Distributional Reinforcement Learning for Multi-Dimensional Reward Functions	Oct 26, 2021	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
The Benefits of Being Categorical Distributional: Uncertainty-aware Regularized Exploration in Reinforcement Learning	Oct 7, 2021	Atari GamesAttribute	—Unverified
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning	Oct 1, 2021	Distributional Reinforcement Learningquantile regression	CodeCode Available
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Towards Understanding Distributional Reinforcement Learning: Regularization, Optimization, Acceleration and Sinkhorn Algorithm	Sep 29, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning with Monotonic Splines	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified
Exploring the Training Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 17, 2021	Density EstimationDistributional Reinforcement Learning	CodeCode Available
Minimizing Safety Interference for Safe and Comfortable Automated Driving with Distributional Reinforcement Learning	Jul 15, 2021	Autonomous VehiclesDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.