Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1726–1750 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow	Mar 26, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Hierarchical and Partially Observable Goal-driven Policy Learning with Goals Relational Graph	Mar 1, 2021	Hierarchical Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Hierarchical Learning-based Graph Partition for Large-scale Vehicle Routing Problems	Feb 12, 2025	Reinforcement Learning (RL)	CodeCode Available	1	5
Environmental effects on emergent strategy in micro-scale multi-agent reinforcement learning	Jul 3, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Evaluating the Performance of Reinforcement Learning Algorithms	Jun 30, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Harnessing Equivariance: Modeling Turbulence with Graph Neural Networks	Apr 10, 2025	Reinforcement Learning (RL)	CodeCode Available	1	5
BEAR: Physics-Principled Building Environment for Control and Reinforcement Learning	Nov 27, 2022	energy managementManagement	CodeCode Available	1	5
EpidemiOptim: A Toolbox for the Optimization of Control Policies in Epidemiological Models	Oct 9, 2020	Deep Reinforcement LearningEpidemiology	CodeCode Available	1	5
Pretraining Representations for Data-Efficient Reinforcement Learning	Jun 9, 2021	Atari GamesAtari Games 100k	CodeCode Available	1	5
Harnessing Mixed Offline Reinforcement Learning Datasets via Trajectory Weighting	Jun 22, 2023	Offline RLreinforcement-learning	CodeCode Available	1	5
ERL-Re^2: Efficient Evolutionary Reinforcement Learning with Shared State Representation and Individual Policy Representation	Oct 26, 2022	continuous-controlContinuous Control	CodeCode Available	1	5
Program Synthesis Guided Reinforcement Learning for Partially Observed Environments	Feb 22, 2021	MinecraftProgram Synthesis	CodeCode Available	1	5
ESRL: Efficient Sampling-based Reinforcement Learning for Sequence Generation	Aug 4, 2023	Abstractive Text SummarizationLanguage Modeling	CodeCode Available	1	5
Evaluating Soccer Player: from Live Camera to Deep Reinforcement Learning	Jan 13, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
BayesSimIG: Scalable Parameter Inference for Adaptive Domain Randomization with IsaacGym	Jul 9, 2021	GPUReinforcement Learning (RL)	CodeCode Available	1	5
Evaluating Long-Term Memory in 3D Mazes	Oct 24, 2022	Navigatereinforcement-learning	CodeCode Available	1	5
BCORLE(): An Offline Reinforcement Learning and Evaluation Framework for Coupons Allocation in E-commerce Market	Dec 1, 2021	Off-policy evaluationreinforcement-learning	CodeCode Available	1	5
Automated Cloud Provisioning on AWS using Deep Reinforcement Learning	Sep 13, 2017	Cloud ComputingDeep Reinforcement Learning	CodeCode Available	1	5
Stable and Safe Reinforcement Learning via a Barrier-Lyapunov Actor-Critic Approach	Apr 8, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1	5
Evening the Score: Targeting SARS-CoV-2 Protease Inhibition in Graph Generative Models for Therapeutic Candidates	May 7, 2021	Drug DesignDrug Discovery	CodeCode Available	1	5
Proximal Gradient Temporal Difference Learning: Stable Reinforcement Learning with Polynomial Sample Complexity	Jun 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Evolutionary Planning in Latent Space	Nov 23, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Evolution Strategies as a Scalable Alternative to Reinforcement Learning	Mar 10, 2017	Atari GamesMuJoCo	CodeCode Available	1	5
Evolutionary Population Curriculum for Scaling Multi-Agent Reinforcement Learning	Mar 23, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Harnessing Discrete Representations For Continual Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 70 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified