Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 137 papers

Title	Date	Tasks	Status
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods	Jul 18, 2024	Atari GamesDecision Making	—Unverified
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion	Oct 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Policy Evaluation in Distributional LQR	Mar 23, 2023	Distributional Reinforcement Learning	—Unverified
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence	May 23, 2024	Distributional Reinforcement LearningPolicy Gradient Methods	—Unverified
Provable Risk-Sensitive Distributional Reinforcement Learning with General Function Approximation	Feb 28, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Risk-averse policies for natural gas futures trading using distributional reinforcement learning	Jan 8, 2025	Distributional Reinforcement Learningenergy trading	—Unverified
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified
Robust Probabilistic Model Checking with Continuous Reward Domains	Feb 6, 2025	Distributional Reinforcement Learningmodel	—Unverified
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 8 of 14Next →

No leaderboard results yet.