Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5176–5200 of 15113 papers

Title	Date	Tasks	Status
ReMIX: Regret Minimization for Monotonic Value Function Factorization in Multiagent Reinforcement Learning	Feb 11, 2023	Decision Makingreinforcement-learning	—Unverified
Remote Electrical Tilt Optimization via Safe Reinforcement Learning	Oct 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Remote Rowhammer Attack using Adversarial Observations on Federated Learning Clients	May 9, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Rendering-Aware Reinforcement Learning for Vector Graphics Generation	May 27, 2025	Code Generationreinforcement-learning	—Unverified
Renewable energy integration and microgrid energy trading using multi-agent deep reinforcement learning	Nov 21, 2021	Deep Reinforcement Learningenergy trading	—Unverified
Renewal Monte Carlo: Renewal theory based reinforcement learning	Apr 3, 2018	Managementreinforcement-learning	—Unverified
Rényi State Entropy for Exploration Acceleration in Reinforcement Learning	Mar 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
REPAINT: Knowledge Transfer in Deep Actor-Critic Reinforcement Learning	Sep 28, 2020	reinforcement-learningReinforcement Learning	—Unverified
REPAINT: Knowledge Transfer in Deep Reinforcement Learning	Nov 24, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reparameterized Policy Learning for Multimodal Trajectory Optimization	Jul 20, 2023	Reinforcement Learning (RL)	—Unverified
Repeated Inverse Reinforcement Learning	May 15, 2017	Imitation Learningreinforcement-learning	—Unverified
Replay across Experiments: A Natural Extension of Off-Policy RL	Nov 27, 2023	Reinforcement Learning (RL)	—Unverified
Replay Buffer with Local Forgetting for Adapting to Local Environment Changes in Deep Model-Based Reinforcement Learning	Mar 15, 2023	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Replicability in Reinforcement Learning	May 31, 2023	reinforcement-learningReinforcement Learning	—Unverified
Replicating Complex Dialogue Policy of Humans via Offline Imitation Learning with Supervised Regularization	May 6, 2023	Decision MakingImitation Learning	—Unverified
REPNP: Plug-and-Play with Deep Reinforcement Learning Prior for Robust Image Restoration	Jul 25, 2022	DeblurringDeep Reinforcement Learning	—Unverified
RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection	Jan 16, 2025	Autonomous DrivingObject	—Unverified
RePreM: Representation Pre-training with Masked Model for Reinforcement Learning	Mar 3, 2023	Data AugmentationLanguage Modeling	—Unverified
Representational efficiency outweighs action efficiency in human program induction	Jul 18, 2018	Hierarchical Reinforcement LearningProgram induction	—Unverified
Representation and Invariance in Reinforcement Learning	Dec 14, 2021	reinforcement-learningReinforcement Learning	—Unverified
Representation and Reinforcement Learning for Personalized Glycemic Control in Septic Patients	Dec 2, 2017	reinforcement-learningReinforcement Learning	—Unverified
Representation Balancing Offline Model-based Reinforcement Learning	Jan 1, 2021	modelModel-based Reinforcement Learning	—Unverified
Representation-based Reward Modeling for Efficient Safety Alignment of Large Language Model	Mar 13, 2025	Language ModelingLanguage Modelling	—Unverified
Frustratingly Easy Regularization on Representation Can Boost Deep Reinforcement Learning	May 29, 2022	Continuous ControlDeep Reinforcement Learning	—Unverified
Representation Learning for Continuous Action Spaces is Beneficial for Efficient Policy Learning	Nov 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 208 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified