Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9401–9450 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning with Structured Hierarchical Grammar Representations of Actions	Oct 7, 2019	Atari GamesQ-Learning	—Unverified
Reinforcement Learning with Subspaces using Free Energy Paradigm	Dec 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Supervision from Noisy Demonstrations	Jun 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning With Temporal Logic Rewards	Dec 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Temporal-Logic-Based Causal Diagrams	Jun 23, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Time-dependent Goals for Robotic Musicians	Nov 11, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Trajectory Feedback	Aug 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Unbiased Policy Evaluation and Linear Function Approximation	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Uncertainty Estimation for Tactical Decision-Making in Intersections	Jun 17, 2020	Autonomous DrivingDecision Making	—Unverified
Reinforcement Learning Your Way: Agent Characterization through Policy Regularization	Jan 21, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Pre-Training	Jun 9, 2025	Language ModelingLanguage Modelling	—Unverified
Reinforcement Speculative Decoding for Fast Ranking	May 23, 2025	Information RetrievalRecommendation Systems	—Unverified
Reinforce Security: A Model-Free Approach Towards Secure Wiretap Coding	Jun 1, 2021	Mutual Information Estimationreinforcement-learning	—Unverified
Single-step Options for Adversary Driving	Mar 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcing Semantic-Symmetry for Document Summarization	Dec 14, 2021	Document Summarizationreinforcement-learning	—Unverified
Reinforcing the Diffusion Chain of Lateral Thought with Diffusion Language Models	May 15, 2025	Code GenerationGSM8K	—Unverified
Reinforcing User Retention in a Billion Scale Short Video Recommender System	Feb 3, 2023	Recommendation Systemsreinforcement-learning	—Unverified
Relate to Predict: Towards Task-Independent Knowledge Representations for Reinforcement Learning	Dec 10, 2022	Inductive BiasObject	—Unverified
Relational Abstractions for Generalized Reinforcement Learning on Symbolic Problems	Apr 27, 2022	Objectreinforcement-learning	—Unverified
Relational Deep Reinforcement Learning for Routing in Wireless Networks	Dec 31, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Relational-Grid-World: A Novel Relational Reasoning Environment and An Agent Model for Relational Information Extraction	Jul 12, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Relation Mention Extraction from Noisy Data with Hierarchical Reinforcement Learning	Nov 3, 2018	DenoisingHierarchical Reinforcement Learning	—Unverified
Relation-R1: Cognitive Chain-of-Thought Guided Reinforcement Learning for Unified Relational Comprehension	Apr 20, 2025	Graph GenerationReinforcement Learning (RL)	—Unverified
Relationship Explainable Multi-objective Reinforcement Learning with Semantic Explainability Generation	Sep 26, 2019	MuJoCoMulti-Objective Reinforcement Learning	—Unverified
Relationship Explainable Multi-objective Optimization Via Vector Value Function Based Reinforcement Learning	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Relative Distributed Formation and Obstacle Avoidance with Multi-agent Reinforcement Learning	Nov 14, 2021	Model Predictive ControlMulti-agent Reinforcement Learning	—Unverified
Relative Importance Sampling for off-Policy Actor-Critic in Deep Reinforcement Learning	Oct 30, 2018	Deep Reinforcement LearningOpenAI Gym	—Unverified
Relative Policy-Transition Optimization for Fast Policy Transfer	Jun 13, 2022	continuous-controlContinuous Control	—Unverified
Optimal Actuator Attacks on Autonomous Vehicles Using Reinforcement Learning	Feb 11, 2025	Autonomous Vehiclesreinforcement-learning	—Unverified
Low-Resource Machine Translation based on Asynchronous Dynamic Programming	Aug 1, 2021	General Reinforcement LearningLow Resource Neural Machine Translation	—Unverified
Low-Switching Policy Gradient with Exploration via Online Sensitivity Sampling	Jun 15, 2023	Reinforcement Learning (RL)Sensitivity	—Unverified
Low-Thrust Orbital Transfer using Dynamics-Agnostic Reinforcement Learning	Oct 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
LPaintB: Learning to Paint from Self-Supervision	Jun 17, 2019	GPUreinforcement-learning	—Unverified
LPMARL: Linear Programming based Implicit Task Assigment for Hiearchical Multi-Agent Reinforcement Learning	Sep 29, 2021	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified
LSD-Net: Look, Step and Detect for Joint Navigation and Multi-View Recognition with Deep Reinforcement Learning	Jan 1, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified
LSTD with Random Projections	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified
LUCIFER: Language Understanding and Context-Infused Framework for Exploration and Behavior Refinement	Jun 9, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
Lyapunov-Based Reinforcement Learning for Decentralized Multi-Agent Control	Sep 20, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Lyapunov-Based Reinforcement Learning State Estimator	Oct 26, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Lyapunov-based uncertainty-aware safe reinforcement learning	Jul 29, 2021	Autonomous DrivingDecision Making	—Unverified
Lyapunov Function Consistent Adaptive Network Signal Control with Back Pressure and Reinforcement Learning	Oct 6, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Lyapunov Robust Constrained-MDPs: Soft-Constrained Robustly Stable Policy Optimization under Model Uncertainty	Aug 5, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Lyceum: An efficient and scalable ecosystem for robot learning	Jan 21, 2020	Model Predictive ControlMuJoCo	—Unverified
M3: Mamba-assisted Multi-Circuit Optimization via MBRL with Effective Scheduling	Nov 25, 2024	MambaReinforcement Learning (RL)	—Unverified
M^3RL: Mind-aware Multi-agent Management Reinforcement Learning	May 1, 2019	ManagementMulti-agent Reinforcement Learning	—Unverified
MA2QL: A Minimalist Approach to Fully Decentralized Multi-Agent Reinforcement Learning	Sep 17, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified
MACC: Cross-Layer Multi-Agent Congestion Control with Deep Reinforcement Learning	Jun 4, 2022	Deep Reinforcement LearningManagement	—Unverified
Machine Learning aided Crop Yield Optimization	Nov 1, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Machine learning and control engineering: The model-free case	Jun 10, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified
Machine Learning Applications in the Routing in Computer Networks	Apr 5, 2021	BIG-bench Machine LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 189 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified