SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3710 of 15113 papers

Title	Date	Tasks	Status
Diffusion Self-Weighted Guidance for Offline Reinforcement Learning	May 23, 2025	Offline RLreinforcement-learning	—Unverified
Deep Reinforcement Learning for QoS-Constrained Resource Allocation in Multiservice Networks	Mar 3, 2020	Deep Reinforcement LearningDistributed Optimization	—Unverified
Costate-focused models for reinforcement learning	Nov 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep reinforcement learning for RAN optimization and control	Nov 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Decentralized Reinforcement Learning for Cooperative Control	Oct 29, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Diffusion Spectral Representation for Reinforcement Learning	Jun 23, 2024	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Real-Time Ground Delay Program Revision and Corresponding Flight Delay Assignments	May 14, 2024	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Resource Management in Network Slicing	May 17, 2018	Deep Reinforcement LearningManagement	—Unverified
A State Aggregation Approach for Solving Knapsack Problem with Deep Reinforcement Learning	Apr 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Accelerating Stochastic Composition Optimization	Jul 25, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 371 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified