Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4231–4240 of 15113 papers

Title	Date	Tasks	Status
Adaptive Trade-Offs in Off-Policy Learning	Oct 16, 2019	Off-policy evaluationreinforcement-learning	—Unverified
Adaptive trading strategies across liquidity pools	Aug 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion	Aug 28, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adaptive Transit Signal Priority based on Deep Reinforcement Learning and Connected Vehicles in a Traffic Microsimulation Environment	Jul 31, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Tree Backup Algorithms for Temporal-Difference Reinforcement Learning	Jun 4, 2022	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Trust Region Policy Optimization: Global Convergence and Faster Rates for Regularized MDPs	Sep 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive User Journeys in Pharma E-Commerce with Reinforcement Learning: Insights from SwipeRx	Aug 15, 2024	ManagementReinforcement Learning (RL)	—Unverified
Adaptive Warm-Start MCTS in AlphaZero-like Deep Reinforcement Learning	May 13, 2021	Board GamesDeep Reinforcement Learning	—Unverified
Adapt-to-Learn: Policy Transfer in Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
AURO: Reinforcement Learning for Adaptive User Retention Optimization in Recommender Systems	Oct 6, 2023	NavigateRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 424 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified