SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4391–4400 of 15113 papers

Title	Date	Tasks	Status
A Finite-Sample Analysis of Distributionally Robust Average-Reward Reinforcement Learning	May 18, 2025	Reinforcement Learning (RL)	—Unverified
A finite time analysis of distributed Q-learning	May 23, 2024	Decision MakingMulti-agent Reinforcement Learning	—Unverified
A Finite-Time Analysis of Q-Learning with Neural Network Function Approximation	Dec 10, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
A First-Occupancy Representation for Reinforcement Learning	Sep 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Flexible Measurement of Diversity in Datasets with Random Network Distillation	Sep 29, 2021	DiversityImage Generation	—Unverified
A Framework and Method for Online Inverse Reinforcement Learning	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Framework for Constrained and Adaptive Behavior-Based Agents	Jun 7, 2015	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Scaling data-driven robotics with reward sketching and batch reinforcement learning	Sep 26, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Framework for dynamically meeting performance objectives on a service mesh	Jun 25, 2023	ManagementReinforcement Learning (RL)	—Unverified
Learning Visual Robotic Control Efficiently with Contrastive Pre-training and Data Augmentation	Dec 14, 2020	Data Augmentationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 440 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified