Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14001–14050 of 15113 papers

Title	Date	Tasks	Status
Concrete Dropout	May 22, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Discrete Action On-Policy Learning with Action-Value Critic	Feb 10, 2020	OpenAI GymReinforcement Learning	CodeCode Available
Discrete and Continuous Action Representation for Practical RL in Video Games	Dec 23, 2019	Control with Prametrised ActionsReinforcement Learning	CodeCode Available
Deep reinforcement learning from human preferences	Jun 12, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Hindsight Learning for MDPs with Exogenous Inputs	Jul 13, 2022	counterfactualDecision Making	CodeCode Available
Hindsight policy gradients	Nov 16, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available
Learning to Perform Local Rewriting for Combinatorial Optimization	Sep 30, 2018	Combinatorial OptimizationReinforcement Learning	CodeCode Available
Feature-Attending Recurrent Modules for Generalization in Reinforcement Learning	Dec 15, 2021	Objectreinforcement-learning	CodeCode Available
Action Advising with Advice Imitation in Deep Reinforcement Learning	Apr 17, 2021	Atari GamesBehavioural cloning	CodeCode Available
Logic-based Reward Shaping for Multi-Agent Reinforcement Learning	Jun 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Discrete State-Action Abstraction via the Successor Representation	Jun 7, 2022	Reinforcement Learning (RL)Transfer Learning	CodeCode Available
Hindsight Trust Region Policy Optimization	Jul 29, 2019	Atari GamesPolicy Gradient Methods	CodeCode Available
Discrete-to-Deep Supervised Policy Learning	May 5, 2020	Reinforcement Learning (RL)	CodeCode Available
Feature Control as Intrinsic Motivation for Hierarchical Reinforcement Learning	May 18, 2017	Hierarchical Reinforcement LearningMontezuma's Revenge	CodeCode Available
Deep Reinforcement Learning from Hierarchical Preference Design	Sep 6, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
H_ Model-free Reinforcement Learning with Robust Stability Guarantee	Nov 7, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available
Deep Reinforcement Learning framework for Autonomous Driving	Apr 8, 2017	Atari GamesAutonomous Driving	CodeCode Available
Deep Reinforcement Learning for Vision-Based Robotic Grasping: A Simulated Comparative Evaluation of Off-Policy Methods	Feb 28, 2018	Deep Reinforcement LearningDiversity	CodeCode Available
Learning to Discretize: Solving 1D Scalar Conservation Laws via Deep Reinforcement Learning	May 27, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Hint assisted reinforcement learning: an application in radio astronomy	Jan 10, 2023	AstronomyModel-based Reinforcement Learning	CodeCode Available
Disentangled (Un)Controllable Features	Oct 31, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Learning robust control for LQR systems with multiplicative noise via policy gradient	May 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Disentangling Abstraction from Statistical Pattern Matching in Human and Machine Learning	Apr 4, 2022	BIG-bench Machine LearningInductive Bias	CodeCode Available
Automatic Goal Generation for Reinforcement Learning Agents	May 17, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Federated Control with Hierarchical Multi-Agent Deep Reinforcement Learning	Dec 22, 2017	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
ComSD: Balancing Behavioral Quality and Diversity in Unsupervised Skill Discovery	Sep 29, 2023	Contrastive LearningDiversity	CodeCode Available
APEX: Empowering LLMs with Physics-Based Task Planning for Real-time Insight	May 20, 2025	Causal InferenceDecision Making	CodeCode Available
Computing the Feedback Capacity of Finite State Channels using Reinforcement Learning	Jan 27, 2020	Computational EfficiencyDecision Making	CodeCode Available
Automatic Discovery of Interpretable Planning Strategies	May 24, 2020	ClusteringDecision Making	CodeCode Available
Aligning an optical interferometer with beam divergence control and continuous action space	Jul 9, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Language Model Alignment with Elastic Reset	Dec 6, 2023	ChatbotLanguage Modeling	CodeCode Available
A Lightweight Calibrated Simulation Enabling Efficient Offline Learning for Optimal Control of Real Buildings	Oct 12, 2023	Reinforcement Learning (RL)	CodeCode Available
Algorithmic Framework for Model-based Deep Reinforcement Learning with Theoretical Guarantees	Jul 10, 2018	continuous-controlContinuous Control	CodeCode Available
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward	Dec 29, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
Automatically Exposing Problems with Neural Dialog Models	Sep 14, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Dissecting Long Reasoning Models: An Empirical Study	Jun 5, 2025	Reinforcement Learning (RL)	CodeCode Available
HOList: An Environment for Machine Learning of Higher-Order Theorem Proving	Apr 5, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available
A learning gap between neuroscience and reinforcement learning	Apr 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Traffic Light Control in Vehicular Networks	Mar 29, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Distance Weighted Supervised Learning for Offline Interaction Data	Apr 26, 2023	Decision MakingImitation Learning	CodeCode Available
Distantly Supervised NER with Partial Annotation Learning and Reinforcement Learning	Aug 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available
APES: a Python toolbox for simulating reinforcement learning environments	Aug 31, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Distillation of RL Policies with Formal Guarantees via Variational Abstraction of Markov Decision Processes (Technical Report)	Dec 17, 2021	Reinforcement Learning (RL)	CodeCode Available
Homogenization of Multi-agent Learning Dynamics in Finite-state Markov Games	Jun 26, 2025	Reinforcement Learning (RL)	CodeCode Available
Intelligent Traffic Light via Policy-based Deep Reinforcement Learning	Dec 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Automated quantum programming via reinforcement learning for combinatorial optimization	Aug 21, 2019	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Language Understanding for Text-based Games Using Deep Reinforcement Learning	Jun 30, 2015	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Intelligent Trainer for Model-Based Reinforcement Learning	May 24, 2018	modelModel-based Reinforcement Learning	CodeCode Available
Deep reinforcement learning for time series: playing idealized trading games	Mar 11, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Automated Proof of Polynomial Inequalities via Reinforcement Learning	Mar 9, 2025	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 281 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified