Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15051–15100 of 15113 papers

Title	Date	Tasks	Status
Back to Basics: Deep Reinforcement Learning in Traffic Signal Control	Sep 15, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Contextualized Hybrid Ensemble Q-learning: Learning Fast with Control Priors	Jun 28, 2024	Car RacingQ-Learning	CodeCode Available
Learning Heuristics over Large Graphs via Deep Reinforcement Learning	Mar 8, 2019	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available
HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym	May 28, 2025	OpenAI GymReinforcement Learning (RL)	CodeCode Available
Contextual Imagined Goals for Self-Supervised Robotic Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Health-Informed Policy Gradients for Multi-Agent Reinforcement Learning	Aug 2, 2019	Multi-agent Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Health Text Simplification: An Annotated Corpus for Digestive Cancer Education and Novel Strategies for Reinforcement Learning	Jan 26, 2024	Domain AdaptationLanguage Modelling	CodeCode Available
Context Meta-Reinforcement Learning via Neuromodulation	Oct 30, 2021	continuous-controlContinuous Control	CodeCode Available
Back to Basics: Benchmarking Canonical Evolution Strategies for Playing Atari	Feb 24, 2018	Atari GamesBenchmarking	CodeCode Available
Infinite Time Horizon Safety of Bayesian Neural Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Self-supervised network distillation: an effective approach to exploration in sparse reward environments	Feb 22, 2023	Atari GamesDecision Making	CodeCode Available
An Actor-Critic Algorithm for Sequence Prediction	Jul 24, 2016	Caption GenerationMachine Translation	CodeCode Available
Exploration Conscious Reinforcement Learning Revisited	Dec 13, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Influence-aware Memory Architectures for Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Influence-Based Multi-Agent Exploration	Oct 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Adversarial Environment Generation for Learning to Navigate the Web	Mar 2, 2021	BenchmarkingDecision Making	CodeCode Available
Arachnophobia Exposure Therapy using Experience-driven Procedural Content Generation via Reinforcement Learning (EDPCGRL)	Oct 7, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Exploration in Action Space	Mar 31, 2020	continuous-controlContinuous Control	CodeCode Available
Context-Aware Visual Policy Network for Sequence-Level Image Captioning	Aug 16, 2018	Deep Reinforcement LearningImage Captioning	CodeCode Available
Influencing Reinforcement Learning through Natural Language Guidance	Apr 4, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Semantic RL with Action Grammars: Data-Efficient Learning of Hierarchical Task Abstractions	Jul 29, 2019	Hierarchical Reinforcement LearningLogical Reasoning	CodeCode Available
Learning how to Active Learn: A Deep Reinforcement Learning Approach	Aug 8, 2017	Active LearningDeep Reinforcement Learning	CodeCode Available
Backprop-Q: Generalized Backpropagation for Stochastic Computation Graphs	Jul 25, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
A Quadratic Actor Network for Model-Free Reinforcement Learning	Mar 11, 2021	continuous-controlContinuous Control	CodeCode Available
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
APRIL: Interactively Learning to Summarise by Combining Active Preference Learning and Reinforcement Learning	Aug 29, 2018	Active Learningreinforcement-learning	CodeCode Available
Information-Driven Adaptive Sensing Based on Deep Reinforcement Learning	Oct 8, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning How to Active Learn by Dreaming	Jul 1, 2019	Active Learningnamed-entity-recognition	CodeCode Available
Heuristics, Answer Set Programming and Markov Decision Process for Solving a Set of Spatial Puzzles	Feb 16, 2019	Q-LearningReinforcement Learning	CodeCode Available
A Multilevel Reinforcement Learning Framework for PDE-based Control	Oct 15, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
A Multi-Document Coverage Reward for RELAXed Multi-Document Summarization	Mar 6, 2022	Computational EfficiencyDocument Summarization	CodeCode Available
Constructing Non-Markovian Decision Process via History Aggregator	Jun 30, 2025	Decision MakingReinforcement Learning (RL)	CodeCode Available
Exploration via Flow-Based Intrinsic Rewards	May 24, 2019	Atari GamesOptical Flow Estimation	CodeCode Available
Exploration via Hindsight Goal Generation	Jun 10, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster Learning	Dec 30, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Modeling Human Exploration Through Resource-Rational Reinforcement Learning	Jan 27, 2022	Meta-Learningreinforcement-learning	CodeCode Available
Information State Embedding in Partially Observable Cooperative Multi-Agent Reinforcement Learning	Apr 2, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Backpropagation through the Void: Optimizing control variates for black-box gradient estimation	Oct 31, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Learning How to Actively Learn: A Deep Imitation Learning Approach	Jul 1, 2018	Active LearningGeneral Classification	CodeCode Available
Exploratory Combinatorial Optimization with Reinforcement Learning	Sep 9, 2019	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Accurate Uncertainties for Deep Learning Using Calibrated Regression	Jul 1, 2018	Deep LearningModel-based Reinforcement Learning	CodeCode Available
Exploratory Gradient Boosting for Reinforcement Learning in Complex Domains	Mar 14, 2016	Minecraftreinforcement-learning	CodeCode Available
Backplay: "Man muss immer umkehren"	Jul 18, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
A Multi-Agent Reinforcement Learning Framework for Off-Policy Evaluation in Two-sided Markets	Feb 21, 2022	ManagementMulti-agent Reinforcement Learning	CodeCode Available
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available
Constrained Reinforcement Learning for Safe Heat Pump Control	Sep 29, 2024	Benchmarkingreinforcement-learning	CodeCode Available
Explore and Exploit with Heterotic Line Bundle Models	Mar 10, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
LESSON: Learning to Integrate Exploration Strategies for Reinforcement Learning via an Option Framework	Oct 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
B2RL: An open-source Dataset for Building Batch Reinforcement Learning	Sep 30, 2022	Managementreinforcement-learning	CodeCode Available
Information-Theoretic State Variable Selection for Reinforcement Learning	Jan 21, 2024	Decision Makingfeature selection	CodeCode Available

Show:10 25 50

← PrevPage 302 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified