Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9651–9675 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning for Multi-Truck Vehicle Routing Problems with Multi-Leg Demand Routes	Jan 8, 2024	DecoderDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Multi-user Massive MIMO with Channel Aging	Feb 14, 2023	Deep Reinforcement LearningManagement	—Unverified
Deep Reinforcement Learning for Navigation in AAA Video Games	Nov 9, 2020	Deep Reinforcement LearningNavigate	—Unverified
Deep Reinforcement Learning for Neural Control	Jun 12, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Reinforcement Learning for NLP	Jul 1, 2018	Atari Gamescoreference-resolution	—Unverified
Deep Reinforcement Learning for On-line Dialogue State Tracking	Sep 22, 2020	Deep Reinforcement LearningDialogue Management	—Unverified
DEAR: Deep Reinforcement Learning for Online Advertising Impression in Recommender Systems	Sep 9, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Online Control of Stochastic Partial Differential Equations	Oct 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Online Routing of Unmanned Aerial Vehicles with Wireless Power Transfer	Apr 25, 2022	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Online Error Detection in Cyber-Physical Systems	Feb 3, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for optical systems: A case study of mode-locked lasers	Jun 10, 2020	Deep Reinforcement LearningNavigate	—Unverified
Deep Reinforcement Learning for Optimal Control of Space Heating	May 10, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Optimal Critical Care Pain Management with Morphine using Dueling Double-Deep Q Networks	Apr 25, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Optimal Investment and Saving Strategy Selection in Heterogeneous Profiles: Intelligent Agents working towards retirement	Jun 12, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Graph Information	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for optimal well control in subsurface systems with uncertain geology	Mar 24, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Optimizing RIS-Assisted HD-FD Wireless Systems	Oct 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Option Replication and Hedging	Sep 9, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Reinforcement Learning for Organ Localization in CT	May 11, 2020	Deep Reinforcement LearningImage Retrieval	—Unverified
Deep Reinforcement Learning for Orienteering Problems Based on Decomposition	Apr 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Page-wise Recommendations	May 7, 2018	Deep Reinforcement LearningRecommendation Systems	—Unverified
Deep Reinforcement Learning for Personalized Search Story Recommendation	Jul 26, 2019	Deep Reinforcement LearningImage Retrieval	—Unverified
Deep Reinforcement Learning for Portfolio Optimization using Latent Feature State Space (LFSS) Module	Feb 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Power Control in Next-Generation WiFi Network Systems	Nov 2, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Domain-adapted Learning and Imitation: DRL for Power Arbitrage	Jan 19, 2023	Imitation Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 387 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified