Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1826–1850 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
First-Explore, then Exploit: Meta-Learning to Solve Hard Exploration-Exploitation Trade-Offs	Jul 5, 2023	Meta-LearningReinforcement Learning (RL)	CodeCode Available	1	5
FlapAI Bird: Training an Agent to Play Flappy Bird Using Reinforcement Learning Techniques	Mar 21, 2020	Q-Learningreinforcement-learning	CodeCode Available	1	5
Flexible Robust Beamforming for Multibeam Satellite Downlink using Reinforcement Learning	Feb 26, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Autonomous Exploration Under Uncertainty via Deep Reinforcement Learning on Graphs	Jul 24, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Flexible Attention-Based Multi-Policy Fusion for Efficient Deep Reinforcement Learning	Oct 7, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Rethinking the Implementation Matters in Cooperative Multi-Agent Reinforcement Learning	Feb 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
HyperNCA: Growing Developmental Networks with Neural Cellular Automata	Apr 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
ICU-Sepsis: A Benchmark MDP Built from Real Medical Data	Jun 9, 2024	BenchmarkingManagement	CodeCode Available	1	5
ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts	May 15, 2025	Continual LearningLanguage Modeling	CodeCode Available	1	5
Forgetful Experience Replay in Hierarchical Reinforcement Learning from Demonstrations	Jun 17, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	1	5
Implementation Matters in Deep Policy Gradients: A Case Study on PPO and TRPO	May 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
FORK: A Forward-Looking Actor For Model-Free Reinforcement Learning	Oct 4, 2020	GPUMuJoCo	CodeCode Available	1	5
For SALE: State-Action Representation Learning for Deep Reinforcement Learning	Jun 4, 2023	continuous-controlContinuous Control	CodeCode Available	1	5
Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors	Jan 9, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
RESPECT: Reinforcement Learning based Edge Scheduling on Pipelined Coral Edge TPUs	Apr 10, 2023	Edge-computingreinforcement-learning	CodeCode Available	1	5
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Rethinking Goal-conditioned Supervised Learning and Its Connection to Offline RL	Feb 9, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1	5
From discrete-time policies to continuous-time diffusion samplers: Asymptotic equivalences and faster training	Jan 10, 2025	Reinforcement Learning (RL)	CodeCode Available	1	5
Rethinking Value Function Learning for Generalization in Reinforcement Learning	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Hybrid Inverse Reinforcement Learning	Feb 13, 2024	continuous-controlContinuous Control	CodeCode Available	1	5
Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for Robotics Control with Action Constraints	Apr 18, 2023	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1	5
Hybrid intelligence for dynamic job-shop scheduling with deep reinforcement learning and attention mechanism	Jan 3, 2022	Deep Reinforcement LearningGraph Representation Learning	CodeCode Available	1	5
AMAGO: Scalable In-Context Reinforcement Learning for Adaptive Agents	Oct 15, 2023	In-Context LearningIn-Context Reinforcement Learning	CodeCode Available	1	5
From Scratch to Sketch: Deep Decoupled Hierarchical Reinforcement Learning for Robotic Sketching Agent	Aug 9, 2022	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Hybrid Multi-agent Deep Reinforcement Learning for Autonomous Mobility on Demand Systems	Dec 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 74 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified