Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5351–5375 of 15113 papers

Title	Date	Tasks	Status
Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs	Jun 17, 2025	Data IntegrationLarge Language Model	—Unverified
RIS-assisted UAV Communications for IoT with Wireless Power Transfer Using Deep Reinforcement Learning	Aug 5, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
RISCLESS: A Reinforcement Learning Strategy to Exploit Unused Cloud Resources	Apr 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Risk-Averse Bayes-Adaptive Reinforcement Learning	Feb 10, 2021	Bayesian Optimisationreinforcement-learning	—Unverified
Risk-Averse Learning by Temporal Difference Methods	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Risk-averse policies for natural gas futures trading using distributional reinforcement learning	Jan 8, 2025	Distributional Reinforcement Learningenergy trading	—Unverified
Risk-Averse Reinforcement Learning via Dynamic Time-Consistent Risk Measures	Jan 14, 2023	Q-Learningreinforcement-learning	—Unverified
Risk Averse Robust Adversarial Reinforcement Learning	Mar 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Risk Averse Value Expansion for Sample Efficient and Robust Policy Learning	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified
Risk Aware and Multi-Objective Decision Making with Distributional Monte Carlo Tree Search	Feb 1, 2021	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
Risk-Aware Reinforcement Learning through Optimal Transport Theory	Sep 12, 2023	Decision MakingManagement	—Unverified
Risk-Aware Safe Reinforcement Learning for Control of Stochastic Linear Systems	May 14, 2025	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Risk-Aware Transfer in Reinforcement Learning using Successor Features	May 28, 2021	Decision Makingreinforcement-learning	—Unverified
Risk-based implementation of COLREGs for autonomous surface vehicles using deep reinforcement learning	Nov 30, 2021	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Risk Bounds and Rademacher Complexity in Batch Reinforcement Learning	Mar 25, 2021	Learning Theoryreinforcement-learning	—Unverified
Risk-Conditioned Distributional Soft Actor-Critic for Risk-Sensitive Navigation	Apr 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Risk-Constrained Reinforcement Learning with Percentile Risk Criteria	Dec 5, 2015	Decision MakingMarketing	—Unverified
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Risk-Sensitive and Robust Model-Based Reinforcement Learning and Planning	Apr 2, 2023	Decision MakingModel-based Reinforcement Learning	—Unverified
Risk-Sensitive Bayesian Games for Multi-Agent Reinforcement Learning under Policy Uncertainty	Mar 18, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Risk-Sensitive Compact Decision Trees for Autonomous Execution in Presence of Simulated Market Response	Jun 5, 2019	Q-Learningreinforcement-learning	—Unverified
Risk Sensitive Dead-end Identification in Safety-Critical Offline Reinforcement Learning	Jan 13, 2023	Decision Makingreinforcement-learning	—Unverified
Risk-Sensitive Deep RL: Variance-Constrained Actor-Critic Provably Finds Globally Optimal Policy	Dec 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Risk-sensitive Markov Decision Process and Learning under General Utility Functions	Nov 22, 2023	Reinforcement Learning (RL)	—Unverified
Risk Sensitive Model-Based Reinforcement Learning using Uncertainty Guided Planning	Nov 9, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 215 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified