Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1626–1650 of 15113 papers

Title	Date	Tasks	Status	Hype
Model-based Constrained Reinforcement Learning using Generalized Control Barrier Function	Mar 2, 2021	Autonomous DrivingCollision Avoidance	CodeCode Available	1
Latent Imagination Facilitates Zero-Shot Transfer in Autonomous Racing	Mar 8, 2021	Autonomous Racingcontinuous-control	CodeCode Available	1
Model-Based Visual Planning with Self-Supervised Functional Distances	Dec 30, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Model-free Deep Reinforcement Learning for Urban Autonomous Driving	Apr 20, 2019	Autonomous DrivingDecision Making	CodeCode Available	1
ModelicaGym: Applying Reinforcement Learning to Modelica Models	Sep 18, 2019	Q-Learningreinforcement-learning	CodeCode Available	1
Combinatorial Optimization with Policy Adaptation using Latent Space Search	Nov 13, 2023	BenchmarkingCombinatorial Optimization	CodeCode Available	1
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings	Jul 23, 2021	Computational EfficiencyDecision Making	CodeCode Available	1
MoDem: Accelerating Visual Model-Based Reinforcement Learning with Demonstrations	Dec 12, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Modular Lifelong Reinforcement Learning via Neural Composition	Jul 1, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation	Apr 14, 2020	Deep Reinforcement LearningInteractive Recommendation	CodeCode Available	1
Combining Deep Reinforcement Learning and Search for Imperfect-Information Games	Jul 27, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Collision Probability Distribution Estimation via Temporal Difference Learning	Jul 29, 2024	AI AgentAutonomous Driving	CodeCode Available	1
Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning	Nov 12, 2019	Combinatorial OptimizationGraph Embedding	CodeCode Available	1
Autonomous Racing using a Hybrid Imitation-Reinforcement Learning Architecture	Oct 11, 2021	Autonomous RacingAutonomous Vehicles	CodeCode Available	1
MOPO: Model-based Offline Policy Optimization	May 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Motif: Intrinsic Motivation from Artificial Intelligence Feedback	Sep 29, 2023	Decision MakingLanguage Modeling	CodeCode Available	1
MPCritic: A plug-and-play MPC architecture for reinforcement learning	Apr 1, 2025	Model Predictive ControlReinforcement Learning (RL)	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
An Empirical Study of Representation Learning for Reinforcement Learning in Healthcare	Nov 23, 2020	Open-Ended Question Answeringreinforcement-learning	CodeCode Available	1
Multi-Agent Car Parking using Reinforcement Learning	Jun 22, 2022	Autonomous DrivingForm	CodeCode Available	1
Multi-Agent Constrained Policy Optimisation	Oct 6, 2021	MuJoCoMulti-agent Reinforcement Learning	CodeCode Available	1
Collaborative Multi-Agent Dialogue Model Training Via Reinforcement Learning	Jul 11, 2019	Natural Language Understandingreinforcement-learning	CodeCode Available	1
Autonomous Reinforcement Learning: Formalism and Benchmarking	Dec 17, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1
Multi-Agent Generative Adversarial Imitation Learning	Jul 26, 2018	Imitation Learningreinforcement-learning	CodeCode Available	1
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning	May 24, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 66 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified