Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11601–11650 of 15113 papers

Title	Date	Tasks	Status
Zooming for Efficient Model-Free Reinforcement Learning in Metric Spaces	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Transfer Learning Approach to Minimize Reinforcement Learning Risks in Energy Optimization for Smart Buildings	Apr 30, 2023	reinforcement-learningReinforcement Learning	—Unverified
RELDEC: Reinforcement Learning-Based Decoding of Moderate Length LDPC Codes	Dec 27, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
ReLeaSER: A Reinforcement Learning Strategy for Optimizing Utilization Of Ephemeral Cloud Resources	Sep 23, 2020	CPUreinforcement-learning	—Unverified
ReLeQ: A Reinforcement Learning Approach for Deep Quantization of Neural Networks	Nov 5, 2018	Deep Reinforcement LearningQuantization	—Unverified
Reliable Critics: Monotonic Improvement and Convergence Guarantees for Reinforcement Learning	Jun 8, 2025	Reinforcement Learning (RL)	—Unverified
Reliable Off-policy Evaluation for Reinforcement Learning	Nov 8, 2020	Decision MakingOff-policy evaluation	—Unverified
Reliable validation of Reinforcement Learning Benchmarks	Mar 2, 2022	BenchmarkingData Compression	—Unverified
Fully Autonomous Real-World Reinforcement Learning with Applications to Mobile Manipulation	Jul 28, 2021	Continual LearningNavigate	—Unverified
ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation	Aug 18, 2020	continuous-controlContinuous Control	—Unverified
ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs	Feb 2, 2023	continuous-controlContinuous Control	—Unverified
REMEDI: REinforcement learning-driven adaptive MEtabolism modeling of primary sclerosing cholangitis DIsease progression	Oct 2, 2023	Reinforcement Learning (RL)	—Unverified
Remember and Forget Experience Replay for Multi-Agent Reinforcement Learning	Mar 24, 2022	continuous-controlContinuous Control	—Unverified
ReMIX: Regret Minimization for Monotonic Value Function Factorization in Multiagent Reinforcement Learning	Feb 11, 2023	Decision Makingreinforcement-learning	—Unverified
Remote Electrical Tilt Optimization via Safe Reinforcement Learning	Oct 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Remote Rowhammer Attack using Adversarial Observations on Federated Learning Clients	May 9, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Rendering-Aware Reinforcement Learning for Vector Graphics Generation	May 27, 2025	Code Generationreinforcement-learning	—Unverified
Renewable energy integration and microgrid energy trading using multi-agent deep reinforcement learning	Nov 21, 2021	Deep Reinforcement Learningenergy trading	—Unverified
Renewal Monte Carlo: Renewal theory based reinforcement learning	Apr 3, 2018	Managementreinforcement-learning	—Unverified
Rényi State Entropy for Exploration Acceleration in Reinforcement Learning	Mar 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
REPAINT: Knowledge Transfer in Deep Actor-Critic Reinforcement Learning	Sep 28, 2020	reinforcement-learningReinforcement Learning	—Unverified
REPAINT: Knowledge Transfer in Deep Reinforcement Learning	Nov 24, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reparameterized Policy Learning for Multimodal Trajectory Optimization	Jul 20, 2023	Reinforcement Learning (RL)	—Unverified
Repeated Inverse Reinforcement Learning	May 15, 2017	Imitation Learningreinforcement-learning	—Unverified
Replay across Experiments: A Natural Extension of Off-Policy RL	Nov 27, 2023	Reinforcement Learning (RL)	—Unverified
Replay Buffer with Local Forgetting for Adapting to Local Environment Changes in Deep Model-Based Reinforcement Learning	Mar 15, 2023	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Replicability in Reinforcement Learning	May 31, 2023	reinforcement-learningReinforcement Learning	—Unverified
Replicating Complex Dialogue Policy of Humans via Offline Imitation Learning with Supervised Regularization	May 6, 2023	Decision MakingImitation Learning	—Unverified
REPNP: Plug-and-Play with Deep Reinforcement Learning Prior for Robust Image Restoration	Jul 25, 2022	DeblurringDeep Reinforcement Learning	—Unverified
RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection	Jan 16, 2025	Autonomous DrivingObject	—Unverified
RePreM: Representation Pre-training with Masked Model for Reinforcement Learning	Mar 3, 2023	Data AugmentationLanguage Modeling	—Unverified
Representational efficiency outweighs action efficiency in human program induction	Jul 18, 2018	Hierarchical Reinforcement LearningProgram induction	—Unverified
Representation and Invariance in Reinforcement Learning	Dec 14, 2021	reinforcement-learningReinforcement Learning	—Unverified
Representation and Reinforcement Learning for Personalized Glycemic Control in Septic Patients	Dec 2, 2017	reinforcement-learningReinforcement Learning	—Unverified
Representation Balancing Offline Model-based Reinforcement Learning	Jan 1, 2021	modelModel-based Reinforcement Learning	—Unverified
Representation-based Reward Modeling for Efficient Safety Alignment of Large Language Model	Mar 13, 2025	Language ModelingLanguage Modelling	—Unverified
Frustratingly Easy Regularization on Representation Can Boost Deep Reinforcement Learning	May 29, 2022	Continuous ControlDeep Reinforcement Learning	—Unverified
Representation Learning for Continuous Action Spaces is Beneficial for Efficient Policy Learning	Nov 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
The Role of Pretrained Representations for the OOD Generalization of Reinforcement Learning Agents	Jul 12, 2021	Reinforcement Learning (RL)Representation Learning	—Unverified
Representation Learning for Out-of-distribution Generalization in Reinforcement Learning	Jun 13, 2021	Out-of-Distribution Generalizationreinforcement-learning	—Unverified
Representation Learning in Deep RL via Discrete Information Bottleneck	Dec 28, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Representation Learning in Low-rank Slate-based Recommender Systems	Sep 10, 2023	Recommendation Systemsreinforcement-learning	—Unverified
Representation Learning on Graphs: A Reinforcement Learning Application	Jan 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Representation Matters: Offline Pretraining for Sequential Decision Making	Feb 11, 2021	Decision MakingImitation Learning	—Unverified
Representations for Stable Off-Policy Reinforcement Learning	Jul 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Representing Entropy : A short proof of the equivalence between soft Q-learning and policy gradients	Jan 1, 2018	Q-Learningreinforcement-learning	—Unverified
ReProHRL: Towards Multi-Goal Navigation in the Real World using Hierarchical Agents	Aug 17, 2023	reinforcement-learningReinforcement Learning	—Unverified
REPTILE: A Proactive Real-Time Deep Reinforcement Learning Self-adaptive Framework	Mar 28, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
RESEARCH ARTICLE A Reinforcement Learning Model of Joy, Distress, Hope and Fear	Sep 8, 2014	reinforcement-learningReinforcement Learning (RL)	—Unverified
	Sep 29, 2021	AttributeDecision Making	—Unverified

Show:10 25 50

← PrevPage 233 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified