SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1771–1780 of 15113 papers

Title	Date	Tasks	Status	Hype
PMIC: Improving Multi-Agent Reinforcement Learning with Progressive Mutual Information Collaboration	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Automatic Curriculum Learning through Value Disagreement	Jun 17, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Automatic Data Augmentation for Generalization in Deep Reinforcement Learning	Jun 23, 2020	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Automatic Data Augmentation for Generalization in Reinforcement Learning	Dec 1, 2021	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Combinatorial Optimization with Policy Adaptation using Latent Space Search	Nov 13, 2023	BenchmarkingCombinatorial Optimization	CodeCode Available	1
Policy Gradient RL Algorithms as Directed Acyclic Graphs	Dec 14, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Policy Learning for Off-Dynamics RL with Deficient Support	Feb 16, 2024	Reinforcement Learning (RL)	CodeCode Available	1
Policy Regularization with Dataset Constraint for Offline Reinforcement Learning	Jun 11, 2023	Offline RLreinforcement-learning	CodeCode Available	1
Combining Reinforcement Learning and Constraint Programming for Combinatorial Optimization	Jun 2, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Comparing Observation and Action Representations for Deep Reinforcement Learning in μRTS	Oct 26, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 178 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified