Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 137 papers

Title	Date	Tasks	Status
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2021	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Automatic Risk Adaptation in Distributional Reinforcement Learning	Jun 11, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning	May 14, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Bayesian Distributional Policy Gradients	Mar 20, 2021	Atari GamesContrastive Learning	—Unverified
Safe Distributional Reinforcement Learning	Feb 26, 2021	Autonomous DrivingDistributional Reinforcement Learning	—Unverified
SENTINEL: Taming Uncertainty with Ensemble-based Distributional Reinforcement Learning	Feb 22, 2021	Decision MakingDistributional Reinforcement Learning	—Unverified
Addressing Inherent Uncertainty: Risk-Sensitive Behavior Generation for Automated Driving using Distributional Reinforcement Learning	Feb 5, 2021	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
Controlling Synthetic Characters in Simulations: A Case for Cognitive Architectures and Sigma	Jan 6, 2021	Distributional Reinforcement LearningUnity	—Unverified
Distributional Reinforcement Learning for Risk-Sensitive Policies	Jan 1, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Distributional Perspective on Actor-Critic Framework	Jan 1, 2021	Distributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 11 of 14Next →

No leaderboard results yet.