Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 137 papers

Title	Date	Tasks	Status
Controlling Synthetic Characters in Simulations: A Case for Cognitive Architectures and Sigma	Jan 6, 2021	Distributional Reinforcement LearningUnity	—Unverified
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified
An introduction to reinforcement learning for neuroscience	Nov 13, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition	Jul 10, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Deep Distributional Learning with Non-crossing Quantile Network	Apr 11, 2025	Distributional Reinforcement Learningquantile regression	—Unverified
Distributional Reinforcement Learning with Online Risk-awareness Adaption	Oct 8, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Bayesian Distributional Policy Gradients	Mar 20, 2021	Atari GamesContrastive Learning	—Unverified
Batch-Constrained Distributional Reinforcement Learning for Session-based Recommendation	Dec 16, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning with Monotonic Splines	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning	Oct 14, 2024	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified
Distributional Reinforcement Learning for Efficient Exploration	May 13, 2019	Atari GamesDistributional Reinforcement Learning	—Unverified
Bellman Diffusion: Generative Modeling as Learning a Linear Operator in the Distribution Space	Oct 2, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning for Risk-Sensitive Policies	Jan 1, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning for mmWave Communications with Intelligent Reflectors on a UAV	Nov 3, 2020	Distributional Reinforcement Learningquantile regression	—Unverified
Automatic Risk Adaptation in Distributional Reinforcement Learning	Jun 11, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes	Mar 1, 2022	Decision MakingDistributional Reinforcement Learning	—Unverified
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning for Smart Grids	May 5, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 2 of 6Next →

No leaderboard results yet.