Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–875 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
DisCor: Corrective Feedback in Reinforcement Learning via Distribution Correction	Mar 16, 2020	Deep Reinforcement LearningMeta-Learning	CodeCode Available	1	5
Federated Reinforcement Learning with Environment Heterogeneity	Apr 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
FedKL: Tackling Data Heterogeneity in Federated Reinforcement Learning by Penalizing KL Divergence	Apr 18, 2022	Federated Learningreinforcement-learning	CodeCode Available	1	5
Diffusion Policies creating a Trust Region for Offline Reinforcement Learning	May 30, 2024	D4RLDenoising	CodeCode Available	1	5
Diffusion-Reinforcement Learning Hierarchical Motion Planning in Multi-agent Adversarial Games	Mar 16, 2024	Autonomous NavigationEfficient Exploration	CodeCode Available	1	5
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks	Oct 29, 2024	MambaReinforcement Learning (RL)	CodeCode Available	1	5
Competitiveness of MAP-Elites against Proximal Policy Optimization on locomotion tasks in deterministic simulations	Sep 17, 2020	Evolutionary AlgorithmsReinforcement Learning (RL)	CodeCode Available	1	5
Compiler Optimization for Quantum Computing Using Reinforcement Learning	Dec 8, 2022	Compiler Optimizationreinforcement-learning	CodeCode Available	1	5
A Unified Approach to Reinforcement Learning, Quantal Response Equilibria, and Two-Player Zero-Sum Games	Jun 12, 2022	Deep Reinforcement LearningMuJoCo Games	CodeCode Available	1	5
Alchemy: A benchmark and analysis toolkit for meta-reinforcement learning agents	Feb 4, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	1	5
Active Inference for Stochastic Control	Aug 27, 2021	Reinforcement Learning (RL)	CodeCode Available	1	5
Automatic Data Augmentation for Generalization in Deep Reinforcement Learning	Jun 23, 2020	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1	5
Diffusion Reward: Learning Rewards via Conditional Video Diffusion	Dec 21, 2023	DiversityReinforcement Learning (RL)	CodeCode Available	1	5
Concise Reasoning via Reinforcement Learning	Apr 7, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Consistency Models as a Rich and Efficient Policy Class for Reinforcement Learning	Sep 29, 2023	Image GenerationOffline RL	CodeCode Available	1	5
FireCommander: An Interactive, Probabilistic Multi-agent Environment for Heterogeneous Robot Teams	Oct 31, 2020	Combinatorial Optimizationreinforcement-learning	CodeCode Available	1	5
DISCOVER: Deep identification of symbolically concise open-form PDEs via enhanced reinforcement-learning	Oct 4, 2022	Deep Reinforcement LearningForm	CodeCode Available	1	5
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations	Jul 20, 2022	Imitation LearningOffline RL	CodeCode Available	1	5
FlapAI Bird: Training an Agent to Play Flappy Bird Using Reinforcement Learning Techniques	Mar 21, 2020	Q-Learningreinforcement-learning	CodeCode Available	1	5
Flexible Attention-Based Multi-Policy Fusion for Efficient Deep Reinforcement Learning	Oct 7, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Augmenting Policy Learning with Routines Discovered from a Single Demonstration	Dec 23, 2020	Atari GamesImitation Learning	CodeCode Available	1	5
Augmenting Reinforcement Learning with Behavior Primitives for Diverse Manipulation Tasks	Oct 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Attractive or Faithful? Popularity-Reinforced Learning for Inspired Headline Generation	Feb 6, 2020	ArticlesHeadline Generation	CodeCode Available	1	5
Confidence Estimation Transformer for Long-term Renewable Energy Forecasting in Reinforcement Learning-based Power Grid Dispatching	Apr 10, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning	May 29, 2023	Prompt LearningReinforcement Learning (RL)	CodeCode Available	1	5

Show:10 25 50

← PrevPage 35 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified