Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1561–1570 of 15113 papers

Title	Date	Tasks	Status	Hype
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified	0
Stage-Wise Reward Shaping for Acrobatic Robots: A Constrained Multi-Objective Reinforcement Learning Approach	Sep 24, 2024	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	2
Energy Saving in 6G O-RAN Using DQN-based xApp	Sep 23, 2024	Reinforcement Learning (RL)	—Unverified	0
Physics Enhanced Residual Policy Learning (PERPL) for safety cruising in mixed traffic platooning under actuator and communication delay	Sep 23, 2024	Reinforcement Learning (RL)	—Unverified	0
Intelligent Routing Algorithm over SDN: Reusable Reinforcement Learning Approach	Sep 23, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
A novel agent with formal goal-reaching guarantees: an experimental study with a mobile robot	Sep 23, 2024	Reinforcement Learning (RL)	—Unverified	0
CANDERE-COACH: Reinforcement Learning from Noisy Feedback	Sep 23, 2024	Imitation Learningreinforcement-learning	—Unverified	0
A Distribution-Aware Flow-Matching for Generating Unstructured Data for Few-Shot Reinforcement Learning	Sep 21, 2024	Few-Shot LearningReinforcement Learning (RL)	—Unverified	0
OMG-RL:Offline Model-based Guided Reward Learning for Heparin Treatment	Sep 20, 2024	Reinforcement Learning (RL)	—Unverified	0
Scalable Multi-agent Reinforcement Learning for Factory-wide Dynamic Scheduling	Sep 20, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 157 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified