Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11701–11750 of 15113 papers

Title	Date	Tasks	Status
Rethinking the Discount Factor in Reinforcement Learning: A Decision Theoretic Approach	Feb 8, 2019	Decision Makingreinforcement-learning	—Unverified
ReTool: Reinforcement Learning for Strategic Tool Use in LLMs	Apr 15, 2025	MathMathematical Reasoning	—Unverified
Retrieval-Augmented Reinforcement Learning	Feb 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Retrieval of surgical phase transitions using reinforcement learning	Aug 1, 2022	Multi-class Classificationreinforcement-learning	—Unverified
Return Augmented Decision Transformer for Off-Dynamics Reinforcement Learning	Oct 30, 2024	D4RLreinforcement-learning	—Unverified
Return-Based Contrastive Representation Learning for Reinforcement Learning	Feb 22, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Return-based Scaling: Yet Another Normalisation Trick for Deep RL	May 11, 2021	Atari Gamesreinforcement-learning	—Unverified
Return Dispersion as an Estimator of Learning Potential for Prioritized Level Replay	Sep 22, 2021	reinforcement-learningReinforcement Learning	—Unverified
Revealing Covert Attention by Analyzing Human and Reinforcement Learning Agent Gameplay	Apr 15, 2025	Reinforcement Learning (RL)	—Unverified
Revealing higher-order neural representations of uncertainty with the Noise Estimation through Reinforcement-based Diffusion (NERD) model	Mar 18, 2025	DenoisingNoise Estimation	—Unverified
Revealing the learning process in reinforcement learning agents through attention-oriented metrics	Jun 20, 2024	Reinforcement Learning (RL)	—Unverified
ReVeal: Self-Evolving Code Agents via Iterative Generation-Verification	Jun 13, 2025	Code Generationreinforcement-learning	—Unverified
Reverse Curriculum Generation for Reinforcement Learning	Jul 17, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reversible Action Design for Combinatorial Optimization with Reinforcement Learning	Feb 14, 2021	Combinatorial OptimizationQ-Learning	—Unverified
Reversible Action Design for Combinatorial Optimization with ReinforcementLearning	Nov 24, 2021	Combinatorial OptimizationQ-Learning	—Unverified
Reversible Upper Confidence Bound Algorithm to Generate Diverse Optimized Candidates	Dec 30, 2021	Drug Discoveryreinforcement-learning	—Unverified
Review, Analysis and Design of a Comprehensive Deep Reinforcement Learning Framework	Feb 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Review of Metrics to Measure the Stability, Robustness and Resilience of Reinforcement Learning	Mar 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Revised Progressive-Hedging-Algorithm Based Two-layer Solution Scheme for Bayesian Reinforcement Learning	Jun 21, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Revisiting Design Choices in Offline Model-Based Reinforcement Learning	Oct 8, 2021	Bayesian OptimizationModel-based Reinforcement Learning	—Unverified
Revisiting Design Choices in Offline Model Based Reinforcement Learning	May 21, 2021	Bayesian OptimizationModel-based Reinforcement Learning	—Unverified
Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning	Jan 20, 2023	continuous-controlContinuous Control	—Unverified
Revisiting Gaussian mixture critics in off-policy reinforcement learning: a sample-based approach	Apr 21, 2022	continuous-controlContinuous Control	—Unverified
Revisiting Peng's Q(λ) for Modern Reinforcement Learning	Feb 27, 2021	continuous-controlContinuous Control	—Unverified
Revisiting Some Common Practices in Cooperative Multi-Agent Reinforcement Learning	Jun 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Revisiting Space Mission Planning: A Reinforcement Learning-Guided Approach for Multi-Debris Rendezvous	Sep 25, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Offline Reinforcement Learning via Linear-Programming with Error-Bound Induced Constraints	Dec 28, 2022	Decision MakingOffline RL	—Unverified
Revisiting the Master-Slave Architecture in Multi-Agent Deep Reinforcement Learning	Dec 20, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Revisiting the Monotonicity Constraint in Cooperative Multi-Agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Revisiting the Roles of “Text” in Text Games	Jan 16, 2022	Natural Language UnderstandingPassage Retrieval	—Unverified
Revisiting the Roles of "Text" in Text Games	Oct 15, 2022	Natural Language UnderstandingPassage Retrieval	—Unverified
Revolutionizing Genomics with Reinforcement Learning Techniques	Feb 26, 2023	Decision Makingreinforcement-learning	—Unverified
REvolve: Reward Evolution with Large Language Models using Human Feedback	Jun 3, 2024	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Reward-agnostic Fine-tuning: Provable Statistical Benefits of Hybrid Reinforcement Learning	May 17, 2023	Offline RLreinforcement-learning	—Unverified
Reward-Aware Proto-Representations in Reinforcement Learning	May 22, 2025	reinforcement-learningReinforcement Learning	—Unverified
Reward-Balancing for Statistical Spoken Dialogue Systems using Multi-objective Reinforcement Learning	Jul 19, 2017	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Reward Biased Maximum Likelihood Estimation for Reinforcement Learning	Nov 16, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Reward Constrained Interactive Recommendation with Natural Language Feedback	May 4, 2020	Interactive RecommendationRecommendation Systems	—Unverified
Reward Design for Driver Repositioning Using Multi-Agent Reinforcement Learning	Feb 17, 2020	Bayesian OptimizationBilevel Optimization	—Unverified
Reward Design in Cooperative Multi-agent Reinforcement Learning for Packet Routing	Mar 5, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reward-Directed Score-Based Diffusion Models via q-Learning	Sep 7, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Reward Estimation via State Prediction	Jan 1, 2018	Predictionreinforcement-learning	—Unverified
Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate Reward	Nov 22, 2024	Image GenerationReinforcement Learning (RL)	—Unverified
Reward-Free Attacks in Multi-Agent Reinforcement Learning	Dec 2, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reward-Free Exploration for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reward-Free Model-Based Reinforcement Learning with Linear Function Approximation	Oct 12, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Reward-Free Policy Space Compression for Reinforcement Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reward-Free RL is No Harder Than Reward-Aware RL in Linear Markov Decision Processes	Jan 26, 2022	Reinforcement Learning (RL)	—Unverified
Reward Function and Initial Values: Better Choices for Accelerated Goal-Directed Reinforcement Learning	Sep 1, 2016	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reward Function Optimization of a Deep Reinforcement Learning Collision Avoidance System	Dec 1, 2022	Collision AvoidanceDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 235 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified