Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13251–13300 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning and Adaptive Sampling for Optimized DNN Compilation	May 30, 2019	ClusteringDiversity	CodeCode Available
Modeling question asking using neural program generation	Jul 23, 2019	DecoderQuestion Generation	CodeCode Available
Robust Reinforcement Learning via Adversarial training with Langevin Dynamics	Feb 14, 2020	MuJoCoreinforcement-learning	CodeCode Available
Off-Dynamics Reinforcement Learning: Training for Transfer with Domain Classifiers	Jun 24, 2020	continuous-controlContinuous Control	CodeCode Available
Obstacle Avoidance and Navigation Utilizing Reinforcement Learning with Reward Shaping	Mar 28, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Observe-R1: Unlocking Reasoning Abilities of MLLMs with Dynamic Progressive Reinforcement Learning	May 18, 2025	Reinforcement Learning (RL)	CodeCode Available
Robust Reinforcement Learning with Dynamic Distortion Risk Measures	Sep 16, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Robust Representation Learning by Clustering with Bisimulation Metrics for Visual Reinforcement Learning with Distractions	Feb 12, 2023	ClusteringReinforcement Learning (RL)	CodeCode Available
Phrase-Level Action Reinforcement Learning for Neural Dialog Response Generation	Aug 1, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Transfer Learning for Automated Test Case Prioritization Using XCSF	Mar 15, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning Agents in Colonel Blotto	Apr 4, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Objective-Reinforced Generative Adversarial Networks (ORGAN) for Sequence Generation Models	May 30, 2017	Molecular Graph GenerationMusic Generation	CodeCode Available
Personalized Multimorbidity Management for Patients with Type 2 Diabetes Using Reinforcement Learning of Electronic Health Records	Oct 29, 2020	Managementreinforcement-learning	CodeCode Available
Personalized Exercise Recommendation with Semantically-Grounded Knowledge Tracing	Jul 15, 2025	Knowledge TracingMath	CodeCode Available
Periodic Intra-Ensemble Knowledge Distillation for Reinforcement Learning	Feb 1, 2020	Knowledge DistillationMuJoCo	CodeCode Available
Unsupervised Predictive Memory in a Goal-Directed Agent	Mar 28, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning	May 29, 2020	Autonomous VehiclesBoard Games	CodeCode Available
Reinforcement Knowledge Graph Reasoning for Explainable Recommendation	Jun 12, 2019	Causal InferenceDecision Making	CodeCode Available
The State of Sparse Training in Deep Reinforcement Learning	Jun 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
ROER: Regularized Optimal Experience Replay	Jul 4, 2024	continuous-controlContinuous Control	CodeCode Available
Rogue-Gym: A New Challenge for Generalization in Reinforcement Learning	Apr 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement and Imitation Learning for Diverse Visuomotor Skills	Feb 26, 2018	Deep Reinforcement LearningImitation Learning	CodeCode Available
MM-KTD: Multiple Model Kalman Temporal Differences for Reinforcement Learning	May 30, 2020	Active Learningreinforcement-learning	CodeCode Available
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems	Jul 18, 2024	Offline RLRecommendation Systems	CodeCode Available
Reinforced Mnemonic Reader for Machine Reading Comprehension	May 8, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Transfer Learning for Prosthetics Using Imitation Learning	Jan 15, 2019	BenchmarkingImitation Learning	CodeCode Available
Novelty Search for Deep Reinforcement Learning Policy Network Weights by Action Sequence Edit Metric Distance	Feb 8, 2019	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available
KRLS: Improving End-to-End Response Generation in Task Oriented Dialog with Reinforced Keywords Learning	Nov 30, 2022	Language ModelingLanguage Modelling	CodeCode Available
Performing Deep Recurrent Double Q-Learning for Atari Games	Aug 16, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Reinforced Cross-modal Alignment for Radiology Report Generation	May 1, 2022	cross-modal alignmentDecision Making	CodeCode Available
ROS2Learn: a reinforcement learning framework for ROS 2	Mar 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforced Continual Learning	May 31, 2018	Continual LearningGeneral Classification	CodeCode Available
Rotation, Translation, and Cropping for Zero-Shot Generalization	Jan 27, 2020	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Novel Policy Seeking with Constrained Optimization	May 21, 2020	DiversityMuJoCo	CodeCode Available
ReinBo: Machine Learning pipeline search and configuration with Bayesian Optimization embedded Reinforcement Learning	Apr 10, 2019	Bayesian OptimizationBIG-bench Machine Learning	CodeCode Available
Transfer Learning for Related Reinforcement Learning Tasks via Image-to-Image Translation	May 31, 2018	Image-to-Image TranslationImitation Learning	CodeCode Available
Performative Reinforcement Learning in Gradually Shifting Environments	Feb 15, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Sim-Anchored Learning for On-the-Fly Adaptation	Jan 17, 2023	Reinforcement Learning (RL)	CodeCode Available
Learning to Score Behaviors for Guided Policy Optimization	Jun 11, 2019	Efficient ExplorationImitation Learning	CodeCode Available
Regularizing Neural Networks for Future Trajectory Prediction via Inverse Reinforcement Learning Framework	Jul 10, 2019	Decoderreinforcement-learning	CodeCode Available
XCSF for Automatic Test Case Prioritization	Nov 4, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
RUDDER: Return Decomposition for Delayed Rewards	Jun 20, 2018	Atari Gamesreinforcement-learning	CodeCode Available
Rule Augmented Unsupervised Constituency Parsing	May 21, 2021	Constituency Parsingreinforcement-learning	CodeCode Available
Transfer of Deep Reactive Policies for MDP Planning	Oct 26, 2018	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Stable Policy Optimization via Off-Policy Divergence Regularization	Mar 9, 2020	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Regularizing Neural Networks by Penalizing Confident Output Distributions	Jan 23, 2017	General Classificationimage-classification	CodeCode Available
Perceiving the World: Question-guided Reinforcement Learning for Text-based Games	Mar 20, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Unsupervised Reinforcement Adaptation for Class-Imbalanced Text Classification	May 26, 2022	ClassificationDomain Adaptation	CodeCode Available
Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement Learning	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available
Margin Trader: A Reinforcement Learning Framework for Portfolio Management with Margin and Constraints	Nov 25, 2023	Deep Reinforcement LearningManagement	CodeCode Available

Show:10 25 50

← PrevPage 266 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified