Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 15113 papers

Title	Date	Tasks	Status	Hype
An End-to-end Deep Reinforcement Learning Approach for the Long-term Short-term Planning on the Frenet Space	Nov 26, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Attractive or Faithful? Popularity-Reinforced Learning for Inspired Headline Generation	Feb 6, 2020	ArticlesHeadline Generation	CodeCode Available	1
CommonPower: A Framework for Safe Data-Driven Smart Grid Control	Jun 5, 2024	Benchmarkingenergy management	CodeCode Available	1
Meta-Reinforcement Learning of Structured Exploration Strategies	Feb 20, 2018	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Meta-SGD: Learning to Learn Quickly for Few-Shot Learning	Jul 31, 2017	Few-Shot LearningMeta-Learning	CodeCode Available	1
Compiler Optimization for Quantum Computing Using Reinforcement Learning	Dec 8, 2022	Compiler Optimizationreinforcement-learning	CodeCode Available	1
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction	Oct 13, 2023	Reinforcement Learning (RL)Unsupervised Pre-training	CodeCode Available	1
Metric Residual Networks for Sample Efficient Goal-Conditioned Reinforcement Learning	Aug 17, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Connecting Deep-Reinforcement-Learning-based Obstacle Avoidance with Conventional Global Planners using Waypoint Generators	Apr 8, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
BAFFLE: Hiding Backdoors in Offline Reinforcement Learning Datasets	Oct 7, 2022	Autonomous DrivingBackdoor Attack	CodeCode Available	1
Continuous Deep Q-Learning with Model-based Acceleration	Mar 2, 2016	continuous-controlContinuous Control	CodeCode Available	1
Mirror Learning: A Unifying Framework of Policy Optimisation	Jan 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
D2RL: Deep Dense Architectures in Reinforcement Learning	Oct 19, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Mixed Policy Gradient: off-policy reinforcement learning driven jointly by data and model	Feb 23, 2021	Decision MakingReinforcement Learning (RL)	CodeCode Available	1
Asynchronous Methods for Deep Reinforcement Learning	Feb 4, 2016	Atari GamesCPU	CodeCode Available	1
Mitigating Open-Vocabulary Caption Hallucinations	Dec 6, 2023	DiversityHallucination	CodeCode Available	1
Asynchronous Multi-Agent Reinforcement Learning for Efficient Real-Time Multi-Robot Cooperative Exploration	Jan 9, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement Learning	Aug 5, 2021	Audio captioningDecoder	CodeCode Available	1
Asynchronous Reinforcement Learning for Real-Time Control of Physical Robots	Mar 23, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Model-Based Active Exploration	Oct 29, 2018	Efficient Explorationmodel	CodeCode Available	1
Model-based graph reinforcement learning for inductive traffic signal control	Aug 1, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Model-based gym environments for limit order book trading	Sep 16, 2022	Algorithmic TradingReinforcement Learning (RL)	CodeCode Available	1
Model-based Reinforcement Learning for Semi-Markov Decision Processes with Neural ODEs	Jun 29, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Model-Based Reinforcement Learning via Latent-Space Collocation	Jun 24, 2021	modelModel-based Reinforcement Learning	CodeCode Available	1
Model-based Safe Deep Reinforcement Learning via a Constrained Proximal Policy Optimization Algorithm	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Model-based Constrained Reinforcement Learning using Generalized Control Barrier Function	Mar 2, 2021	Autonomous DrivingCollision Avoidance	CodeCode Available	1
Latent Imagination Facilitates Zero-Shot Transfer in Autonomous Racing	Mar 8, 2021	Autonomous Racingcontinuous-control	CodeCode Available	1
Model-Based Visual Planning with Self-Supervised Functional Distances	Dec 30, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Model-free Deep Reinforcement Learning for Urban Autonomous Driving	Apr 20, 2019	Autonomous DrivingDecision Making	CodeCode Available	1
ModelicaGym: Applying Reinforcement Learning to Modelica Models	Sep 18, 2019	Q-Learningreinforcement-learning	CodeCode Available	1
Combinatorial Optimization with Policy Adaptation using Latent Space Search	Nov 13, 2023	BenchmarkingCombinatorial Optimization	CodeCode Available	1
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings	Jul 23, 2021	Computational EfficiencyDecision Making	CodeCode Available	1
MoDem: Accelerating Visual Model-Based Reinforcement Learning with Demonstrations	Dec 12, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Modular Lifelong Reinforcement Learning via Neural Composition	Jul 1, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation	Apr 14, 2020	Deep Reinforcement LearningInteractive Recommendation	CodeCode Available	1
Combining Deep Reinforcement Learning and Search for Imperfect-Information Games	Jul 27, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Collision Probability Distribution Estimation via Temporal Difference Learning	Jul 29, 2024	AI AgentAutonomous Driving	CodeCode Available	1
Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning	Nov 12, 2019	Combinatorial OptimizationGraph Embedding	CodeCode Available	1
Autonomous Racing using a Hybrid Imitation-Reinforcement Learning Architecture	Oct 11, 2021	Autonomous RacingAutonomous Vehicles	CodeCode Available	1
MOPO: Model-based Offline Policy Optimization	May 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Motif: Intrinsic Motivation from Artificial Intelligence Feedback	Sep 29, 2023	Decision MakingLanguage Modeling	CodeCode Available	1
MPCritic: A plug-and-play MPC architecture for reinforcement learning	Apr 1, 2025	Model Predictive ControlReinforcement Learning (RL)	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
An Empirical Study of Representation Learning for Reinforcement Learning in Healthcare	Nov 23, 2020	Open-Ended Question Answeringreinforcement-learning	CodeCode Available	1
Multi-Agent Car Parking using Reinforcement Learning	Jun 22, 2022	Autonomous DrivingForm	CodeCode Available	1
Multi-Agent Constrained Policy Optimisation	Oct 6, 2021	MuJoCoMulti-agent Reinforcement Learning	CodeCode Available	1
Collaborative Multi-Agent Dialogue Model Training Via Reinforcement Learning	Jul 11, 2019	Natural Language Understandingreinforcement-learning	CodeCode Available	1
Autonomous Reinforcement Learning: Formalism and Benchmarking	Dec 17, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1
Multi-Agent Generative Adversarial Imitation Learning	Jul 26, 2018	Imitation Learningreinforcement-learning	CodeCode Available	1
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning	May 24, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 33 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified