Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 137 papers

Title	Date	Tasks	Status	Hype
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics	May 4, 2024	continuous-controlContinuous Control	CodeCode Available	0
Statistical Efficiency of Distributional Temporal Difference Learning and Freedman's Inequality in Hilbert Spaces	Mar 9, 2024	Distributional Reinforcement Learning	—Unverified	0
Provable Risk-Sensitive Distributional Reinforcement Learning with General Function Approximation	Feb 28, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Uncertainty-Aware Transient Stability-Constrained Preventive Redispatch: A Distributional Reinforcement Learning Approach	Feb 14, 2024	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
A Distributional Analogue to the Successor Representation	Feb 13, 2024	Distributional Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Near-Minimax-Optimal Distributional Reinforcement Learning with a Generative Model	Feb 12, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified	0
Echoes of Socratic Doubt: Embracing Uncertainty in Calibrated Evidential Reinforcement Learning	Feb 11, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
Distributional Off-policy Evaluation with Bellman Residual Minimization	Feb 2, 2024	Distributional Reinforcement LearningOff-policy evaluation	CodeCode Available	0
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In Distributional Reinforcement Learning	Jan 4, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified	0
Noise Distribution Decomposition based Multi-Agent Distributional Reinforcement Learning	Dec 12, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Distributional Bellman Operators over Mean Embeddings	Dec 9, 2023	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
An introduction to reinforcement learning for neuroscience	Nov 13, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Beyond Average Return in Markov Decision Processes	Oct 31, 2023	Distributional Reinforcement Learning	—Unverified	0
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion	Oct 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Estimation and Inference in Distributional Reinforcement Learning	Sep 29, 2023	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning	Sep 25, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Value-Distributional Model-Based Reinforcement Learning	Aug 12, 2023	continuous-controlContinuous Control	CodeCode Available	0
Variance Control for Distributional Reinforcement Learning	Jul 30, 2023	Distributional Reinforcement LearningMuJoCo	CodeCode Available	0
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified	0
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning	Jul 4, 2023	Distributional Reinforcement Learningmodel	CodeCode Available	0
Is Risk-Sensitive Reinforcement Learning Properly Resolved?	Jul 2, 2023	Distributional Reinforcement LearningManagement	—Unverified	0

Show:10 25 50

← PrevPage 2 of 6Next →

No leaderboard results yet.