Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 137 papers

Title	Date	Tasks	Status
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning	Jan 3, 2025	Decision MakingDistributional Reinforcement Learning	CodeCode Available
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets	Nov 2, 2024	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning	Oct 14, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Bellman Diffusion: Generative Modeling as Learning a Linear Operator in the Distribution Space	Oct 2, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
Offline and Distributional Reinforcement Learning for Radio Resource Management	Sep 25, 2024	Distributional Reinforcement LearningManagement	—Unverified
Foundations of Multivariate Distributional Reinforcement Learning	Aug 31, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
EX-DRL: Hedging Against Heavy Losses with EXtreme Distributional Reinforcement Learning	Aug 22, 2024	Distributional Reinforcement Learningquantile regression	CodeCode Available
Bellman Unbiasedness: Toward Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation	Jul 31, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
On Policy Evaluation Algorithms in Distributional Reinforcement Learning	Jul 19, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods	Jul 18, 2024	Atari GamesDecision Making	—Unverified
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence	May 23, 2024	Distributional Reinforcement LearningPolicy Gradient Methods	—Unverified
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics	May 4, 2024	continuous-controlContinuous Control	CodeCode Available
Statistical Efficiency of Distributional Temporal Difference Learning and Freedman's Inequality in Hilbert Spaces	Mar 9, 2024	Distributional Reinforcement Learning	—Unverified
Provable Risk-Sensitive Distributional Reinforcement Learning with General Function Approximation	Feb 28, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Uncertainty-Aware Transient Stability-Constrained Preventive Redispatch: A Distributional Reinforcement Learning Approach	Feb 14, 2024	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Near-Minimax-Optimal Distributional Reinforcement Learning with a Generative Model	Feb 12, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified
Echoes of Socratic Doubt: Embracing Uncertainty in Calibrated Evidential Reinforcement Learning	Feb 11, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Distributional Off-policy Evaluation with Bellman Residual Minimization	Feb 2, 2024	Distributional Reinforcement LearningOff-policy evaluation	CodeCode Available
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In Distributional Reinforcement Learning	Jan 4, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified
Noise Distribution Decomposition based Multi-Agent Distributional Reinforcement Learning	Dec 12, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Distributional Bellman Operators over Mean Embeddings	Dec 9, 2023	Atari GamesDeep Reinforcement Learning	CodeCode Available
An introduction to reinforcement learning for neuroscience	Nov 13, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Beyond Average Return in Markov Decision Processes	Oct 31, 2023	Distributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 2 of 6Next →

No leaderboard results yet.