Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3276–3300 of 15113 papers

Title	Date	Tasks	Status	Score
Hierarchical Reinforcement Learning for Concurrent Discovery of Compound and Composable Policies	May 23, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Modular Multi-Objective Deep Reinforcement Learning with Decision Values	Apr 21, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Modular Multitask Reinforcement Learning with Policy Sketches	Nov 6, 2016	continuous-controlContinuous Control	CodeCode Available	5
Hindsight policy gradients	Nov 16, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available	5
ComSD: Balancing Behavioral Quality and Diversity in Unsupervised Skill Discovery	Sep 29, 2023	Contrastive LearningDiversity	CodeCode Available	5
A Threshold-based Scheme for Reinforcement Learning in Neural Networks	Sep 12, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	5
Dealing with Sparse Rewards in Reinforcement Learning	Oct 21, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Computing the Feedback Capacity of Finite State Channels using Reinforcement Learning	Jan 27, 2020	Computational EfficiencyDecision Making	CodeCode Available	5
Hierarchical Cooperative Multi-Agent Reinforcement Learning with Skill Discovery	Dec 7, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	5
Reinforcement Learning from Hierarchical Critics	Feb 8, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
DEAR: Disentangled Environment and Agent Representations for Reinforcement Learning without Reconstruction	Jun 30, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Hierarchical Decentralized Deep Reinforcement Learning Architecture for a Simulated Four-Legged Agent	Sep 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Heuristics, Answer Set Programming and Markov Decision Process for Solving a Set of Spatial Puzzles	Feb 16, 2019	Q-LearningReinforcement Learning	CodeCode Available	5
A Reinforcement Learning Approach to Sensing Design in Resource-Constrained Wireless Networked Control Systems	Apr 1, 2022	Decision MakingReinforcement Learning (RL)	CodeCode Available	5
Active One-shot Learning	Feb 21, 2017	ClassificationGeneral Classification	CodeCode Available	5
Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation	Apr 20, 2016	Deep Reinforcement LearningMontezuma's Revenge	CodeCode Available	5
HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym	May 28, 2025	OpenAI GymReinforcement Learning (RL)	CodeCode Available	5
MORAL: Aligning AI with Human Norms through Multi-Objective Reinforced Active Learning	Dec 30, 2021	Active LearningEthics	CodeCode Available	5
MORE-3S:Multimodal-based Offline Reinforcement Learning with Shared Semantic Spaces	Feb 20, 2024	Decision MakingOffline RL	CodeCode Available	5
A reinforcement learning approach to rare trajectory sampling	May 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Health-Informed Policy Gradients for Multi-Agent Reinforcement Learning	Aug 2, 2019	Multi-agent Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
Harnessing Structures for Value-Based Planning and Reinforcement Learning	Sep 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Health Text Simplification: An Annotated Corpus for Digestive Cancer Education and Novel Strategies for Reinforcement Learning	Jan 26, 2024	Domain AdaptationLanguage Modelling	CodeCode Available	5
Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL	Jul 20, 2024	Few-Shot Text ClassificationQ-Learning	CodeCode Available	5
HAMMER: Multi-Level Coordination of Reinforcement Learning Agents via Learned Messaging	Jan 18, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 132 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified