Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1676–1700 of 15113 papers

Title	Date	Tasks	Status	Hype
NavRep: Unsupervised Representations for Reinforcement Learning of Robot Navigation in Dynamic Human Environments	Dec 8, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
Negative Update Intervals in Deep Multi-Agent Reinforcement Learning	Sep 13, 2018	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Attractive or Faithful? Popularity-Reinforced Learning for Inspired Headline Generation	Feb 6, 2020	ArticlesHeadline Generation	CodeCode Available	1
An empirical investigation of the challenges of real-world reinforcement learning	Mar 24, 2020	continuous-controlContinuous Control	CodeCode Available	1
BabyAI 1.1	Jul 24, 2020	Computational EfficiencyImitation Learning	CodeCode Available	1
Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning	Jun 7, 2020	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	1
Neural Inventory Control in Networks via Hindsight Differentiable Policy Optimization	Jun 20, 2023	Deep Reinforcement LearningManagement	CodeCode Available	1
Collective eXplainable AI: Explaining Cooperative Strategies and Agent Contribution in Multiagent Reinforcement Learning with Shapley Values	Oct 4, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Neural Motion Simulator: Pushing the Limit of World Models in Reinforcement Learning	Apr 9, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	1
Collision Probability Distribution Estimation via Temporal Difference Learning	Jul 29, 2024	AI AgentAutonomous Driving	CodeCode Available	1
Combining Deep Reinforcement Learning and Search for Imperfect-Information Games	Jul 27, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
NICE: Robust Scheduling through Reinforcement Learning-Guided Integer Programming	Sep 24, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Stable and Safe Human-aligned Reinforcement Learning through Neural Ordinary Differential Equations	Jan 23, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1
Neural Ordinary Differential Equation Control of Dynamics on Graphs	Jun 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning for Combining Search Methods in the Calibration of Economic ABMs	Feb 23, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
COG: Connecting New Skills to Past Experience with Offline Reinforcement Learning	Oct 27, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Coevolving with the Other You: Fine-Tuning LLM with Sequential Cooperative Multi-Agent Reinforcement Learning	Oct 8, 2024	GSM8KMulti-agent Reinforcement Learning	CodeCode Available	1
Object Detection with Deep Reinforcement Learning	Aug 9, 2022	Active Object LocalizationDeep Reinforcement Learning	CodeCode Available	1
Objective Mismatch in Model-based Reinforcement Learning	Feb 11, 2020	modelModel-based Reinforcement Learning	CodeCode Available	1
Co-Activation Graph Analysis of Safety-Verified and Explainable Deep Reinforcement Learning Policies	Jan 6, 2025	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Backprop-Free Reinforcement Learning with Active Neural Generative Coding	Jul 10, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
Offline Meta-Reinforcement Learning with Advantage Weighting	Aug 13, 2020	Machine TranslationMeta-Learning	CodeCode Available	1
Offline Meta-Reinforcement Learning with Online Self-Supervision	Jul 8, 2021	Meta Reinforcement LearningOffline RL	CodeCode Available	1
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks	Dec 6, 2021	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Co-designing Intelligent Control of Building HVACs and Microgrids	Jul 18, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 68 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified