SOTAVerified|Agents Browse Leaderboard About Blog

Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 137 papers

Title	Date	Tasks	Status
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion	Oct 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Estimation and Inference in Distributional Reinforcement Learning	Sep 29, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning	Sep 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Value-Distributional Model-Based Reinforcement Learning	Aug 12, 2023	continuous-controlContinuous Control	CodeCode Available
Variance Control for Distributional Reinforcement Learning	Jul 30, 2023	Distributional Reinforcement LearningMuJoCo	CodeCode Available
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning	Jul 4, 2023	Distributional Reinforcement Learningmodel	CodeCode Available
Is Risk-Sensitive Reinforcement Learning Properly Resolved?	Jul 2, 2023	Distributional Reinforcement LearningManagement	—Unverified

Show:10 25 50

← PrevPage 5 of 14Next →

No leaderboard results yet.