Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12601–12650 of 15113 papers

Title	Date	Tasks	Status
Stabilizing Unsupervised Environment Design with a Learned Adversary	Aug 21, 2023	Car Racingcontinuous-control	—Unverified
Stabilizing Visual Reinforcement Learning via Asymmetric Interactive Cooperation	Jan 1, 2023	reinforcement-learningReinforcement Learning	—Unverified
Stable and Efficient Policy Evaluation	Jun 6, 2020	Reinforcement Learning (RL)	—Unverified
Stable Continual Reinforcement Learning via Diffusion-based Trajectory Replay	Nov 16, 2024	reinforcement-learningReinforcement Learning	—Unverified
Stable deep reinforcement learning method by predicting uncertainty in rewards as a subtask	Jan 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Stable Modular Control via Contraction Theory for Reinforcement Learning	Nov 7, 2023	reinforcement-learningReinforcement Learning	—Unverified
Stable Reinforcement Learning for Optimal Frequency Control: A Distributed Averaging-Based Integral Approach	May 1, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Stable Reinforcement Learning with Unbounded State Space	Jun 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Stable Relay Learning Optimization Approach for Fast Power System Production Cost Minimization Simulation	Dec 19, 2023	Imitation LearningReinforcement Learning (RL)	—Unverified
Stackelberg Batch Policy Learning	Sep 28, 2023	Decision MakingReinforcement Learning (RL)	—Unverified
Staged Reinforcement Learning for Complex Tasks through Decomposed Environments	Nov 5, 2023	reinforcement-learningReinforcement Learning	—Unverified
Standardized feature extraction from pairwise conflicts applied to the train rescheduling problem	Apr 6, 2022	feature selectionreinforcement-learning	—Unverified
StaQ it! Growing neural networks for Policy Mirror Descent	Jun 16, 2025	Reinforcement Learning (RL)	—Unverified
StarCraft II Build Order Optimization using Deep Reinforcement Learning and Monte-Carlo Tree Search	Jun 12, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
StarCraftImage: A Dataset For Prototyping Spatial Reasoning Methods For Multi-Agent Environments	Jan 9, 2024	ImputationReinforcement Learning (RL)	—Unverified
State2vec: Off-Policy Successor Features Approximators	Oct 22, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
State Abstractions for Lifelong Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
State-Action Joint Regularized Implicit Policy for Offline Reinforcement Learning	Sep 29, 2021	D4RLreinforcement-learning	—Unverified
State Action Separable Reinforcement Learning	Jun 5, 2020	Decision Makingreinforcement-learning	—Unverified
State Advantage Weighting for Offline RL	Oct 9, 2022	D4RLOffline RL	—Unverified
State Alignment-based Imitation Learning	Nov 21, 2019	Imitation Learningreinforcement-learning	—Unverified
State and Action Factorization in Power Grids	Sep 3, 2024	reinforcement-learningReinforcement Learning	—Unverified
State-Augmentation Transformations for Risk-Sensitive Reinforcement Learning	Apr 16, 2018	Q-Learningreinforcement-learning	—Unverified
State Augmented Constrained Reinforcement Learning: Overcoming the Limitations of Learning with Rewards	Feb 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
State-Aware Proximal Pessimistic Algorithms for Offline Reinforcement Learning	Nov 28, 2022	Offline RLQ-Learning	—Unverified
State-based Episodic Memory for Multi-Agent Reinforcement Learning	Oct 19, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
State Combinatorial Generalization In Decision Making With Conditional Diffusion Models	Jan 22, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
State Dropout-Based Curriculum Reinforcement Learning for Self-Driving at Unsignalized Intersections	Jul 10, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified
State of the Art of Reinforcement Learning	Jan 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
State of the Art of User Simulation approaches for conversational information retrieval	Jan 10, 2022	Decision MakingInformation Retrieval	—Unverified
State Regularized Policy Optimization on Data with Dynamics Shift	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified
State Representation Learning for Goal-Conditioned Reinforcement Learning	May 4, 2022	reinforcement-learningReinforcement Learning	—Unverified
State Representation Learning from Demonstration	Sep 15, 2019	Imitation LearningReinforcement Learning	—Unverified
State representation learning with recurrent capsule networks	Dec 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
State-Separated SARSA: A Practical Sequential Decision-Making Algorithm with Recovering Rewards	Mar 18, 2024	Decision MakingQ-Learning	—Unverified
State Space Decomposition and Subgoal Creation for Transfer in Deep Reinforcement Learning	May 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
State-wise Safe Reinforcement Learning: A Survey	Feb 6, 2023	Autonomous Drivingreinforcement-learning	—Unverified
Static Neural Compiler Optimization via Deep Reinforcement Learning	Aug 20, 2020	Compiler OptimizationDeep Reinforcement Learning	—Unverified
Statistical CSI-based Beamforming for RIS-Aided Multiuser MISO Systems using Deep Reinforcement Learning	Sep 3, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Statistical Guarantees for Lifelong Reinforcement Learning using PAC-Bayes Theory	Nov 1, 2024	reinforcement-learningReinforcement Learning	—Unverified
Statistical Inference After Adaptive Sampling for Longitudinal Data	Feb 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Statistically Model Checking PCTL Specifications on Markov Decision Processes via Reinforcement Learning	Apr 1, 2020	NegationQ-Learning	—Unverified
Statistics and Samples in Distributional Reinforcement Learning	Feb 21, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Learning Skills to Navigate without a Master: A Sequential Multi-Policy Reinforcement Learning Algorithm	Jan 30, 2021	Autonomous NavigationHierarchical Reinforcement Learning	—Unverified
Steady State Analysis of Episodic Reinforcement Learning	Nov 12, 2020	Continual Learningreinforcement-learning	—Unverified
Steady-State Error Compensation for Reinforcement Learning with Quadratic Rewards	Feb 14, 2024	reinforcement-learningReinforcement Learning	—Unverified
Stealing Deep Reinforcement Learning Models for Fun and Profit	Jun 9, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Stealthy and Efficient Adversarial Attacks against Deep Reinforcement Learning	May 14, 2020	Adversarial AttackDeep Reinforcement Learning	—Unverified
Steering LLM Reasoning Through Bias-Only Adaptation	May 24, 2025	GSM8KMath	—Unverified
STEERING: Stein Information Directed Exploration for Model-Based Reinforcement Learning	Jan 28, 2023	Model-based Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 253 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified