Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 137 papers

Title	Date	Tasks	Status
Diverse Projection Ensembles for Distributional Reinforcement Learning	Jun 12, 2023	Distributional Reinforcement LearningDiversity	—Unverified
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm	Jun 11, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
Improving the generalizability and robustness of large-scale traffic signal control	Jun 2, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
The Statistical Benefits of Quantile Temporal-Difference Learning for Value Estimation	May 28, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning	May 25, 2023	Distributional Reinforcement LearningOffline RL	CodeCode Available
One-Step Distributional Reinforcement Learning	Apr 27, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Policy Evaluation in Distributional LQR	Mar 23, 2023	Distributional Reinforcement Learning	—Unverified
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement Learning	Mar 3, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control	Feb 22, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 7 of 14Next →

No leaderboard results yet.