Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3676–3700 of 15113 papers

Title	Date	Tasks	Status
DEAR: Deep Reinforcement Learning for Online Advertising Impression in Recommender Systems	Sep 9, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Online Control of Stochastic Partial Differential Equations	Oct 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Online Routing of Unmanned Aerial Vehicles with Wireless Power Transfer	Apr 25, 2022	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified
Deep reinforcement learning for optical systems: A case study of mode-locked lasers	Jun 10, 2020	Deep Reinforcement LearningNavigate	—Unverified
Deep Reinforcement Learning for Optimal Control of Space Heating	May 10, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Optimal Critical Care Pain Management with Morphine using Dueling Double-Deep Q Networks	Apr 25, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
A State Augmentation based approach to Reinforcement Learning from Human Preferences	Feb 17, 2023	reinforcement-learningReinforcement Learning	—Unverified
Autonomous Overtaking in Gran Turismo Sport Using Curriculum Reinforcement Learning	Mar 26, 2021	Car Racingreinforcement-learning	—Unverified
Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Graph Information	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for optimal well control in subsurface systems with uncertain geology	Mar 24, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Optimizing RIS-Assisted HD-FD Wireless Systems	Oct 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Option Replication and Hedging	Sep 9, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Reinforcement Learning for Organ Localization in CT	May 11, 2020	Deep Reinforcement LearningImage Retrieval	—Unverified
Deep Reinforcement Learning for Orienteering Problems Based on Decomposition	Apr 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Cost-Aware Dynamic Cloud Workflow Scheduling using Self-Attention and Evolutionary Reinforcement Learning	Sep 27, 2024	Reinforcement Learning (RL)Scheduling	—Unverified
Deep Reinforcement Learning for Personalized Search Story Recommendation	Jul 26, 2019	Deep Reinforcement LearningImage Retrieval	—Unverified
Autonomous Quadrotor Landing using Deep Reinforcement Learning	Sep 11, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Autonomous Platoon Control with Integrated Deep Reinforcement Learning and Dynamic Programming	Jun 15, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Costate-focused models for reinforcement learning	Nov 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Power Control in Next-Generation WiFi Network Systems	Nov 2, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Decentralized Reinforcement Learning for Cooperative Control	Oct 29, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A State Aggregation Approach for Solving Knapsack Problem with Deep Reinforcement Learning	Apr 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Process Control: A Primer for Beginners	Apr 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Accelerating Stochastic Composition Optimization	Jul 25, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 148 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified