SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4210 of 15113 papers

Title	Date	Tasks	Status
Adaptive patch foraging in deep reinforcement learning agents	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
Adaptive Policy Transfer in Reinforcement Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Probabilistic Trajectory Optimization via Efficient Approximate Inference	Aug 22, 2016	Model Predictive ControlReinforcement Learning	—Unverified
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified
Adaptive Q-Network: On-the-fly Target Selection for Deep Reinforcement Learning	May 25, 2024	Atari GamesAutoML	—Unverified
Adaptive Reinforcement Learning for Unobservable Random Delays	Jun 17, 2025	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Reinforcement Learning for State Avoidance in Discrete Event Systems	Feb 28, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
Adaptive Reinforcement Learning Model for Simulation of Urban Mobility during Crises	Sep 2, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 421 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified