Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14251–14300 of 15113 papers

Title	Date	Tasks	Status
A User Simulator for Task-Completion Dialogues	Dec 17, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning-based Exploration of Web Applications	May 15, 2023	Deep Reinforcement LearningDiversity	CodeCode Available
Deep Reinforcement Learning: An Overview	Jan 25, 2017	Deep Reinforcement LearningMachine Translation	CodeCode Available
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models	May 25, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Entropy Regularized Reinforcement Learning Using Large Deviation Theory	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
A Unified Framework for Alternating Offline Model Training and Policy Learning	Oct 12, 2022	continuous-controlContinuous Control	CodeCode Available
Clipped-Objective Policy Gradients for Pessimistic Policy Optimization	Nov 10, 2023	Deep Reinforcement LearningMulti-Task Learning	CodeCode Available
DQN-TAMER: Human-in-the-Loop Reinforcement Learning with Intractable Feedback	Oct 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Hybridising Reinforcement Learning and Heuristics for Hierarchical Directed Arc Routing Problems	Jan 1, 2025	ARCreinforcement-learning	CodeCode Available
Climate Adaptation with Reinforcement Learning: Experiments with Flooding and Transportation in Copenhagen	Sep 27, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available
Annealing Optimization for Progressive Learning with Stochastic Approximation	Sep 6, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning Algorithm for Dynamic Pricing of Express Lanes with Multiple Access Locations	Sep 10, 2019	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Deep Quality-Value (DQV) Learning	Sep 30, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Client Selection for Federated Policy Optimization with Environment Heterogeneity	May 18, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available
Hybrid Latent Reasoning via Reinforcement Learning	May 24, 2025	reinforcement-learningReinforcement Learning	CodeCode Available
Clickbait? Sensational Headline Generation with Auto-tuned Reinforcement Learning	Sep 9, 2019	Headline Generationreinforcement-learning	CodeCode Available
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available
DeepQTest: Testing Autonomous Driving Systems with Reinforcement Learning and Real-world Weather Data	Oct 8, 2023	Autonomous DrivingQ-Learning	CodeCode Available
A Hitchhiker's Guide to Statistical Comparisons of Reinforcement Learning Algorithms	Mar 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Q-learning from Demonstrations	Apr 12, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
Deep Q learning for fooling neural networks	Nov 13, 2018	Q-LearningReinforcement Learning	CodeCode Available
Augmenting Replay in World Models for Continual Reinforcement Learning	Jan 30, 2024	Continual LearningModel-based Reinforcement Learning	CodeCode Available
Learning to Evolve	May 8, 2019	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available
Local and Global Explanations of Agent Behavior: Integrating Strategy Summaries with Saliency Maps	May 18, 2020	Atari GamesDecision Making	CodeCode Available
Long Short-Term Memory for Spatial Encoding in Multi-Agent Path Planning	Mar 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Q-Learning based Reinforcement Learning Approach for Network Intrusion Detection	Nov 27, 2021	Intrusion DetectionNetwork Intrusion Detection	CodeCode Available
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning	Jul 20, 2017	DiversityGraph Embedding	CodeCode Available
Learning Phase Competition for Traffic Signal Control	May 12, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Detecting Rewards Deterioration in Episodic Reinforcement Learning	Oct 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
A Hierarchical Framework for Relation Extraction with Reinforcement Learning	Nov 9, 2018	Entity Extraction using GANHierarchical Reinforcement Learning	CodeCode Available
DRiLLS: Deep Reinforcement Learning for Logic Synthesis	Nov 11, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Adaptive Traffic Control with Deep Reinforcement Learning:Towards State-of-the-art and Beyond	Jul 21, 2020	Decision Makingreinforcement-learning	CodeCode Available
A Semi-Supervised Approach for Low-Resourced Text Generation	Jun 3, 2019	DecoderDenoising	CodeCode Available
Deep Ordinal Reinforcement Learning	May 6, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
An Investigation of Time Reversal Symmetry in Reinforcement Learning	Nov 28, 2023	Data AugmentationFriction	CodeCode Available
Learning Actionable Representations with Goal-Conditioned Policies	Nov 19, 2018	Decision MakingHierarchical Reinforcement Learning	CodeCode Available
Model-free optimization of power/efficiency tradeoffs in quantum thermal machines using reinforcement learning	Apr 10, 2022	FrictionReinforcement Learning (RL)	CodeCode Available
Hybrid Reinforcement Learning with Expert State Sequences	Mar 11, 2019	Atari GamesImitation Learning	CodeCode Available
Driving in Dense Traffic with Model-Free Reinforcement Learning	Sep 15, 2019	continuous-controlContinuous Control	CodeCode Available
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available
Hybrid Reward Architecture for Reinforcement Learning	Jun 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Driving Reinforcement Learning with Models	Nov 11, 2019	Model Predictive Controlreinforcement-learning	CodeCode Available
Interval timing in deep reinforcement learning agents	May 31, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Classification with Costly Features using Deep Reinforcement Learning	Nov 20, 2017	ClassificationClassification with Costly Features	CodeCode Available
Deep Object-Centric Representations for Generalizable Robot Learning	Aug 14, 2017	ObjectReinforcement Learning	CodeCode Available
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available
AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting	May 24, 2025	GSM8KReinforcement Learning (RL)	CodeCode Available
Accelerated Reinforcement Learning for Sentence Generation by Vocabulary Prediction	Sep 5, 2018	GPUImage Captioning	CodeCode Available

Show:10 25 50

← PrevPage 286 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified