Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8676–8700 of 15113 papers

Title	Date	Tasks	Status
Optimizing Medical Treatment for Sepsis in Intensive Care: from Reinforcement Learning to Pre-Trial Evaluation	Mar 13, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Optimizing Memory Mapping Using Deep Reinforcement Learning	May 11, 2023	Cloud ComputingDecision Making	—Unverified
Optimizing Memory Placement using Evolutionary Graph Reinforcement Learning	Jul 14, 2020	Network Pruningreinforcement-learning	—Unverified
Optimizing Multiagent Cooperation via Policy Evolution and Shared Experiences	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Optimizing Navigation And Chemical Application in Precision Agriculture With Deep Reinforcement Learning And Conditional Action Tree	Mar 23, 2025	Decision MakingDeep Reinforcement Learning	—Unverified
Optimizing Nitrogen Management with Deep Reinforcement Learning and Crop Simulations	Apr 21, 2022	Deep Reinforcement LearningManagement	—Unverified
Optimizing Novelty of Top-k Recommendations using Large Language Models and Reinforcement Learning	Jun 20, 2024	Product RecommendationReinforcement Learning (RL)	—Unverified
Optimizing Portfolio with Two-Sided Transactions and Lending: A Reinforcement Learning Framework	Aug 9, 2024	ManagementReinforcement Learning (RL)	—Unverified
Optimizing Prompt Strategies for SAM: Advancing lesion Segmentation Across Diverse Medical Imaging Modalities	Dec 23, 2024	Lesion SegmentationReinforcement Learning (RL)	—Unverified
Optimizing Quantum Error Correction Codes with Reinforcement Learning	Dec 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Optimizing Query Evaluations using Reinforcement Learning for Web Search	Apr 12, 2018	reinforcement-learningReinforcement Learning	—Unverified
Optimizing Routerless Network-on-Chip Designs: An Innovative Learning-Based Framework	May 11, 2019	Deep Reinforcement LearningEfficient Exploration	—Unverified
Optimizing Sensor Redundancy in Sequential Decision-Making Problems	Dec 10, 2024	Decision MakingOpenAI Gym	—Unverified
Optimizing Sponsored Search Ranking Strategy by Deep Reinforcement Learning	Mar 20, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Optimizing Taxi Carpool Policies via Reinforcement Learning and Spatio-Temporal Mining	Nov 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
Optimizing Tensor Network Contraction Using Reinforcement Learning	Apr 18, 2022	Combinatorial Optimizationreinforcement-learning	—Unverified
Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning	Mar 10, 2025	MathMeta Reinforcement Learning	—Unverified
Optimizing the Factual Correctness of a Summary: A Study of Summarizing Radiology Reports	Nov 6, 2019	Abstractive Text SummarizationFact Checking	—Unverified
Optimizing the Long-Term Average Reward for Continuing MDPs: A Technical Report	Apr 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Optimizing the Long-Term Behaviour of Deep Reinforcement Learning for Pushing and Grasping	Apr 7, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Optimizing Traffic Lights with Multi-agent Deep Reinforcement Learning and V2X communication	Feb 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Optimizing Trajectories for Highway Driving with Offline Reinforcement Learning	Mar 21, 2022	Autonomous DrivingOffline RL	—Unverified
Optimizing Wireless Discontinuous Reception via MAC Signaling Learning	Jun 19, 2024	Reinforcement Learning (RL)	—Unverified
Option Compatible Reward Inverse Reinforcement Learning	Nov 7, 2019	reinforcement-learningReinforcement Learning	—Unverified
Option Discovery in Hierarchical Reinforcement Learning using Spatio-Temporal Clustering	May 17, 2016	ClusteringHierarchical Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 348 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified