Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 137 papers

Title	Date	Tasks	Status	Score
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning	Jul 4, 2023	Distributional Reinforcement Learningmodel	CodeCode Available	5
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
Distributional Bellman Operators over Mean Embeddings	Dec 9, 2023	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Distributional Reinforcement Learning with Regularized Wasserstein Loss	Feb 1, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Distributional Reinforcement Learning for Energy-Based Sequential Models	Dec 18, 2019	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In Distributional Reinforcement Learning	Jan 4, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Distributional Reinforcement Learning for Multi-Dimensional Reward Functions	Oct 26, 2021	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	5
Distributional Reinforcement Learning with Quantile Regression	Oct 27, 2017	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Estimation and Inference in Distributional Reinforcement Learning	Sep 29, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	5
Estimating Risk and Uncertainty in Deep Reinforcement Learning	May 23, 2019	Bayesian InferenceDeep Reinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 4 of 14Next →

No leaderboard results yet.