Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4131–4140 of 15113 papers

Title	Date	Tasks	Status
ACTRCE: Augmenting Experience via Teacher’s Advice	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
ActSafe: Active Exploration with Safety Constraints for Reinforcement Learning	Oct 12, 2024	Efficient Explorationreinforcement-learning	—Unverified
A Cubic-regularized Policy Newton Algorithm for Reinforcement Learning	Apr 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning	May 17, 2025	Reinforcement Learning (RL)	—Unverified
AdaCred: Adaptive Causal Decision Transformers with Feature Crediting	Dec 19, 2024	AttributeImitation Learning	—Unverified
AdaMemento: Adaptive Memory-Assisted Policy Optimization for Reinforcement Learning	Oct 6, 2024	Ensemble Learningreinforcement-learning	—Unverified
Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps	Dec 22, 2024	Reinforcement Learning (RL)	—Unverified
Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation	Jun 9, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified
adaPARL: Adaptive Privacy-Aware Reinforcement Learning for Sequential-Decision Making Human-in-the-Loop Systems	Mar 7, 2023	Decision MakingReinforcement Learning (RL)	—Unverified
AdaPool: A Diurnal-Adaptive Fleet Management Framework using Model-Free Deep Reinforcement Learning and Change Point Detection	Apr 1, 2021	Change Point DetectionDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 414 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified