Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3301–3325 of 15113 papers

Title	Date	Tasks	Status	Score
A Reinforcement Learning Approach to Sensing Design in Resource-Constrained Wireless Networked Control Systems	Apr 1, 2022	Decision MakingReinforcement Learning (RL)	CodeCode Available	5
A Tree Search Algorithm for Sequence Labeling	Apr 29, 2018	ChunkingDecision Making	CodeCode Available	5
Hierarchical Cooperative Multi-Agent Reinforcement Learning with Skill Discovery	Dec 7, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	5
Active One-shot Learning	Feb 21, 2017	ClassificationGeneral Classification	CodeCode Available	5
Reinforcement Learning from Hierarchical Critics	Feb 8, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
A reinforcement learning approach to rare trajectory sampling	May 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Health-Informed Policy Gradients for Multi-Agent Reinforcement Learning	Aug 2, 2019	Multi-agent Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym	May 28, 2025	OpenAI GymReinforcement Learning (RL)	CodeCode Available	5
Health Text Simplification: An Annotated Corpus for Digestive Cancer Education and Novel Strategies for Reinforcement Learning	Jan 26, 2024	Domain AdaptationLanguage Modelling	CodeCode Available	5
Heuristics, Answer Set Programming and Markov Decision Process for Solving a Set of Spatial Puzzles	Feb 16, 2019	Q-LearningReinforcement Learning	CodeCode Available	5
Harnessing Structures for Value-Based Planning and Reinforcement Learning	Sep 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Hierarchically Structured Task-Agnostic Continual Learning	Nov 14, 2022	Continual Learningreinforcement-learning	CodeCode Available	5
Hint assisted reinforcement learning: an application in radio astronomy	Jan 10, 2023	AstronomyModel-based Reinforcement Learning	CodeCode Available	5
Hybrid Reinforcement Learning with Expert State Sequences	Mar 11, 2019	Atari GamesImitation Learning	CodeCode Available	5
Improving Robustness of Deep Reinforcement Learning Agents: Environment Attack based on the Critic Network	Apr 7, 2021	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	5
A Reinforcement Learning Approach to Domain-Knowledge Inclusion Using Grammar Guided Symbolic Regression	Feb 9, 2022	regressionreinforcement-learning	CodeCode Available	5
Computational Benefits of Intermediate Rewards for Goal-Reaching Policy Learning	Jul 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available	5
gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo	Mar 14, 2019	BenchmarkingOpenAI Gym	CodeCode Available	5
Gym-Ignition: Reproducible Robotic Simulations for Reinforcement Learning	Nov 5, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	5
Guiding Evolutionary Strategies by Differentiable Robot Simulators	Oct 1, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Guided Exploration in Reinforcement Learning via Monte Carlo Critic Optimization	Jun 25, 2022	continuous-controlContinuous Control	CodeCode Available	5
Guided Dialogue Policy Learning without Adversarial Learning in the Loop	Nov 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Guided Feature Transformation (GFT): A Neural Language Grounding Module for Embodied Agents	May 22, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Guided Dialog Policy Learning: Reward Estimation for Multi-Domain Task-Oriented Dialog	Aug 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Adversarial Online Multi-Task Reinforcement Learning	Jan 11, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 133 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified