Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1976–2000 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
How Far I'll Go: Offline Goal-Conditioned Reinforcement Learning via f-Advantage Regression	Jun 7, 2022	regressionreinforcement-learning	CodeCode Available	1	5
BIMRL: Brain Inspired Meta Reinforcement Learning	Oct 29, 2022	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Solving Challenging Dexterous Manipulation Tasks With Trajectory Optimisation and Reinforcement Learning	Sep 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Integrating Deep Reinforcement Learning with Model-based Path Planners for Automated Driving	Feb 2, 2020	Deep Reinforcement LearningNavigate	CodeCode Available	1	5
Interaction Pattern Disentangling for Multi-Agent Reinforcement Learning	Jul 8, 2022	DiversityMulti-agent Reinforcement Learning	CodeCode Available	1	5
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets	Oct 6, 2023	D4RLDecision Making	CodeCode Available	1	5
Solving the Traveling Salesperson Problem with Precedence Constraints by Deep Reinforcement Learning	Jul 4, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
When should we prefer Decision Transformers for Offline Reinforcement Learning?	May 23, 2023	D4RLImitation Learning	CodeCode Available	1	5
Human-Inspired Multi-Agent Navigation using Knowledge Distillation	Mar 18, 2021	Collision AvoidanceKnowledge Distillation	CodeCode Available	1	5
Human-Level Control through Directly-Trained Deep Spiking Q-Networks	Dec 13, 2021	Atari Gamesreinforcement-learning	CodeCode Available	1	5
Battlesnake Challenge: A Multi-agent Reinforcement Learning Playground with Human-in-the-loop	Jul 20, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC	Nov 6, 2024	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1	5
Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning	Nov 4, 2018	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1	5
Information Design in Multi-Agent Reinforcement Learning	May 8, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning	Jun 10, 2025	Reinforcement Learning (RL)	CodeCode Available	1	5
Beyond Pick-and-Place: Tackling Robotic Stacking of Diverse Shapes	Oct 12, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1	5
SQIL: Imitation Learning via Reinforcement Learning with Sparse Rewards	May 27, 2019	Imitation LearningMuJoCo	CodeCode Available	1	5
SQUIRE: A Sequence-to-sequence Framework for Multi-hop Knowledge Graph Reasoning	Jan 17, 2022	DecoderNavigate	CodeCode Available	1	5
SREC: Proactive Self-Remedy of Energy-Constrained UAV-Based Networks via Deep Reinforcement Learning	Sep 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Hybrid Multi-agent Deep Reinforcement Learning for Autonomous Mobility on Demand Systems	Dec 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Stability Constrained Reinforcement Learning for Decentralized Real-Time Voltage Control	Sep 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Bayesian Generational Population-Based Training	Jul 19, 2022	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1	5
HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning	Mar 19, 2024	Reinforcement Learning (RL)Visual Grounding	CodeCode Available	1	5
An Alternative Softmax Operator for Reinforcement Learning	Dec 16, 2016	Decision Makingreinforcement-learning	CodeCode Available	1	5
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress	Jun 3, 2022	Atari GamesHumanoid Control	CodeCode Available	1	5

Show:10 25 50

← PrevPage 80 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified