Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2476–2500 of 15113 papers

Title	Date	Tasks	Status	Score
Latent Intention Dialogue Models	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
A Machine with Short-Term, Episodic, and Semantic Memory Systems	Dec 5, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available	5
Latent Guided Sampling for Combinatorial Optimization	Jun 4, 2025	Combinatorial OptimizationDrug Discovery	CodeCode Available	5
LatentPoison - Adversarial Attacks On The Latent Space	Nov 8, 2017	DecoderGeneral Classification	CodeCode Available	5
Large Language Models are Autonomous Cyber Defenders	May 7, 2025	Reinforcement Learning (RL)	CodeCode Available	5
Large Language Models are Biased Reinforcement Learners	May 19, 2024	Decision MakingIn-Context Learning	CodeCode Available	5
Autonomous Option Invention for Continual Hierarchical Reinforcement Learning and Planning	Dec 20, 2024	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Autonomous Navigation via Deep Reinforcement Learning for Resource Constraint Edge Nodes using Transfer Learning	Oct 12, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	5
Adaptive Natural Language Generation for Task-oriented Dialogue via Reinforcement Learning	Sep 16, 2022	Natural Language Understandingreinforcement-learning	CodeCode Available	5
Learning a model is paramount for sample efficiency in reinforcement learning control of PDEs	Feb 14, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Language Understanding for Text-based Games Using Deep Reinforcement Learning	Jun 30, 2015	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Autonomous Management of Energy-Harvesting IoT Nodes Using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement LearningManagement	CodeCode Available	5
Language Model Alignment with Elastic Reset	Dec 6, 2023	ChatbotLanguage Modeling	CodeCode Available	5
Language as an Abstraction for Hierarchical Deep Reinforcement Learning	Jun 18, 2019	Deep Reinforcement LearningInstruction Following	CodeCode Available	5
Skynet: A Top Deep RL Agent in the Inaugural Pommerman Team Competition	Apr 20, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
Langevin DQN	Feb 17, 2020	Computational EfficiencyOpen-Ended Question Answering	CodeCode Available	5
A Lyapunov-based Approach to Safe Reinforcement Learning	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available	5
LaGR-SEQ: Language-Guided Reinforcement Learning with Sample-Efficient Querying	Aug 21, 2023	Decision Makingreinforcement-learning	CodeCode Available	5
Laboratory Experiments of Model-based Reinforcement Learning for Adaptive Optics Control	Dec 30, 2023	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5
L2SR: Learning to Sample and Reconstruct for Accelerated MRI via Reinforcement Learning	Dec 5, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Koopman Spectrum Nonlinear Regulators and Efficient Online Learning	Jun 30, 2021	Decision Makingreinforcement-learning	CodeCode Available	5
L2Explorer: A Lifelong Reinforcement Learning Assessment Environment	Mar 14, 2022	Continual LearningLifelong learning	CodeCode Available	5
Large Language Model-Driven Curriculum Design for Mobile Networks	May 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Learning and Policy Search in Stochastic Dynamical Systems with Bayesian Neural Networks	May 23, 2016	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5
Autonomous Braking System via Deep Reinforcement Learning	Feb 8, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 100 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified