Distributional Reinforcement Learning

Value distribution is the distribution of the random return received by a reinforcement learning agent. it been used for a specific purpose such as implementing risk-aware behaviour.

We have random return Z whose expectation is the value Q. This random return is also described by a recursive equation, but one of a distributional nature

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 111–120 of 137 papers

Title	Date	Tasks	Status
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
Conservative Distributional Reinforcement Learning with Safety Constraints	Jan 18, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Controlling Synthetic Characters in Simulations: A Case for Cognitive Architectures and Sigma	Jan 6, 2021	Distributional Reinforcement LearningUnity	—Unverified
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent	Jul 13, 2023	Distributional Reinforcement Learning	—Unverified
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition	Jul 10, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Deep Distributional Learning with Non-crossing Quantile Network	Apr 11, 2025	Distributional Reinforcement Learningquantile regression	—Unverified
Deep Reinforcement Learning for Artificial Upwelling Energy Management	Aug 20, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning for Smart Grids	May 5, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified
Distributional Reinforcement Learning-based Energy Arbitrage Strategies in Imbalance Settlement Mechanism	Dec 23, 2023	Distributional Reinforcement LearningQ-Learning	—Unverified

Show:10 25 50

← PrevPage 12 of 14Next →

No leaderboard results yet.