Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 137 papers

Title	Date	Tasks	Status	Hype
Diverse Projection Ensembles for Distributional Reinforcement Learning	Jun 12, 2023	Distributional Reinforcement LearningDiversity	—Unverified	0
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm	Jun 11, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified	0
Improving the generalizability and robustness of large-scale traffic signal control	Jun 2, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
The Statistical Benefits of Quantile Temporal-Difference Learning for Value Estimation	May 28, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified	0
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning	May 25, 2023	Distributional Reinforcement LearningOffline RL	CodeCode Available	0
One-Step Distributional Reinforcement Learning	Apr 27, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Policy Evaluation in Distributional LQR	Mar 23, 2023	Distributional Reinforcement Learning	—Unverified	0
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement Learning	Mar 3, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control	Feb 22, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	0
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Trust Region-Based Safe Distributional Reinforcement Learning for Multiple Constraints	Jan 26, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-compartment Neuron and Population Encoding Powered Spiking Neural Network for Deep Distributional Reinforcement Learning	Jan 18, 2023	Atari GamesDistributional Reinforcement Learning	—Unverified	0
An Analysis of Quantile Temporal-Difference Learning	Jan 11, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Risk-Sensitive Policy with Distributional Reinforcement Learning	Dec 30, 2022	Decision MakingDistributional Reinforcement Learning	CodeCode Available	1
Invariance to Quantile Selection in Distributional Continuous Control	Dec 29, 2022	continuous-controlContinuous Control	—Unverified	0
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified	0
Intelligent Resource Allocation in Joint Radar-Communication With Graph Neural Networks	Oct 17, 2022	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization?	Sep 29, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Normality-Guided Distributional Reinforcement Learning for Continuous Control	Aug 28, 2022	continuous-controlContinuous Control	—Unverified	0
The Nature of Temporal Difference Errors in Multi-step Distributional Reinforcement Learning	Jul 15, 2022	Distributional Reinforcement Learningquantile regression	—Unverified	0
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Reinforcement Learning with Distributional Risk-averse formulation	Jun 14, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
A Simulation Environment and Reinforcement Learning Method for Waste Reduction	May 30, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 3 of 6Next →

No leaderboard results yet.