Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8851–8900 of 15113 papers

Title	Date	Tasks	Status
Recurrent World Models Facilitate Policy Evolution	Sep 4, 2018	reinforcement-learningReinforcement Learning	—Unverified
Recursive Constraints to Prevent Instability in Constrained Reinforcement Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning	—Unverified
Recursive Least Squares Advantage Actor-Critic Algorithms	Jan 15, 2022	Computational Efficiencycontinuous-control	—Unverified
Recursive Reasoning Graph for Multi-Agent Reinforcement Learning	Mar 6, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Recursive Reinforcement Learning	Jun 23, 2022	IngenuityQ-Learning	—Unverified
Recursive Sparse Pseudo-input Gaussian Process SARSA	Nov 17, 2018	reinforcement-learningReinforcement Learning	—Unverified
Redirection Controller Using Reinforcement Learning	Sep 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Rediscovering Affordance: A Reinforcement Learning Perspective	Dec 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
RedStar: Does Scaling Long-CoT Data Unlock Better Slow-Reasoning Systems?	Jan 20, 2025	MathReinforcement Learning (RL)	—Unverified
Reduce Computational Cost In Deep Reinforcement Learning Via Randomized Policy Learning	May 25, 2025	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reduced-Dimensional Reinforcement Learning Control using Singular Perturbation Approximations	Apr 29, 2020	Clusteringreinforcement-learning	—Unverified
Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement Learning	May 2, 2021	Graph AttentionInductive Learning	—Unverified
Reducing Conservativeness Oriented Offline Reinforcement Learning	Feb 27, 2021	D4RLreinforcement-learning	—Unverified
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
Reducing Planning Complexity of General Reinforcement Learning with Non-Markovian Abstractions	Dec 26, 2021	Decision MakingGeneral Reinforcement Learning	—Unverified
Reducing Risk for Assistive Reinforcement Learning Policies with Diffusion Models	May 13, 2024	Imitation Learningreinforcement-learning	—Unverified
Reducing the Deployment-Time Inference Control Costs of Deep Reinforcement Learning Agents via an Asymmetric Architecture	May 30, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Re-examining Routing Networks for Multi-task Learning	Jan 1, 2021	Multi-Task Learningreinforcement-learning	—Unverified
REFINE-AF: A Task-Agnostic Framework to Align Language Models via Self-Generated Instructions using Reinforcement Learning from Automated Feedback	May 10, 2025	Reinforcement Learning (RL)	—Unverified
Refine and Imitate: Reducing Repetition and Inconsistency in Persuasion Dialogues via Reinforcement Learning and Human Demonstration	Dec 31, 2020	Language ModellingReinforcement Learning (RL)	—Unverified
Refined Continuous Control of DDPG Actors via Parametrised Activation	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage	Feb 5, 2023	Offline RLQ-Learning	—Unverified
REFINING MONTE CARLO TREE SEARCH AGENTS BY MONTE CARLO TREE SEARCH	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
REFUEL: Exploring Sparse Features in Deep Reinforcement Learning for Fast Disease Diagnosis	Dec 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforced Genetic Algorithm Learning for Optimizing Computation Graphs	May 7, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Regioned Episodic Reinforcement Learning	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Region Growing Curriculum Generation for Reinforcement Learning	Jul 4, 2018	reinforcement-learningReinforcement Learning	—Unverified
Regression with Linear Factored Functions	Dec 19, 2014	Gaussian Processesregression	—Unverified
Regret Analysis in Deterministic Reinforcement Learning	Jun 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Regret Analysis of Certainty Equivalence Policies in Continuous-Time Linear-Quadratic Systems	Jun 9, 2022	reinforcement-learningReinforcement Learning	—Unverified
Regret Bounds and Reinforcement Learning Exploration of EXP-based Algorithms	Sep 20, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Regret Bounds for Discounted MDPs	Feb 12, 2020	Q-LearningReinforcement Learning	—Unverified
Regret Bounds for Information-Directed Reinforcement Learning	Jun 9, 2022	reinforcement-learningReinforcement Learning	—Unverified
Regret Bounds for Learning State Representations in Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Regret Bounds for Markov Decision Processes with Recursive Optimized Certainty Equivalents	Jan 30, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Regret Bounds for Reinforcement Learning via Markov Chain Concentration	Aug 6, 2018	reinforcement-learningReinforcement Learning	—Unverified
Regret Bounds for Reinforcement Learning with Policy Advice	May 5, 2013	reinforcement-learningReinforcement Learning	—Unverified
Regret Bounds for Risk-Sensitive Reinforcement Learning	Oct 11, 2022	reinforcement-learningReinforcement Learning	—Unverified
Regret-Free Reinforcement Learning for LTL Specifications	Nov 18, 2024	reinforcement-learningReinforcement Learning	—Unverified
Regret Minimization for Reinforcement Learning by Evaluating the Optimal Bias Function	Jun 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning	Jun 5, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Regularization Guarantees Generalization in Bayesian Reinforcement Learning through Algorithmic Stability	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Compositional Transfer in Hierarchical Reinforcement Learning	Jun 26, 2019	General Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Regularized Inverse Reinforcement Learning	Oct 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Regularize! Don't Mix: Multi-Agent Reinforcement Learning without Explicit Centralized Structures	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Regularized Parameter Uncertainty for Improving Generalization in Reinforcement Learning	Jan 1, 2024	Out-of-Distribution Generalizationreinforcement-learning	—Unverified
Regularized Policies are Reward Robust	Jan 18, 2021	reinforcement-learningReinforcement Learning	—Unverified
Regularized Policy Iteration	Dec 1, 2008	L2 Regularizationreinforcement-learning	—Unverified
Regularized Q-learning	Feb 11, 2022	Q-Learningreinforcement-learning	—Unverified
Regularizing Action Policies for Smooth Control with Reinforcement Learning	Dec 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 178 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified