Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3601–3625 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning for Data-Driven Adaptive Scanning in Ptychography	Mar 29, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Day-to-day Dynamic Tolling in Tradable Credit Schemes	Apr 10, 2025	Bayesian OptimizationComputational Efficiency	—Unverified
Deep Reinforcement Learning for Demand Driven Services in Logistics and Transportation Systems: A Survey	Aug 10, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Automatic Text Summarization Using Reinforcement Learning with Embedding Features	Nov 1, 2017	ARCInformation Retrieval	—Unverified
Deep Reinforcement Learning for DER Cyber-Attack Mitigation	Sep 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Detecting Malicious Websites	May 22, 2019	Deep Reinforcement LearningPhishing Website Detection	—Unverified
Cost-Sensitive Exploration in Bayesian Reinforcement Learning	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Dexterous Manipulation with Concept Networks	Sep 20, 2017	Deep Reinforcement LearningMuJoCo	—Unverified
Deep Reinforcement Learning for Distributed Uncoordinated Cognitive Radios Resource Allocation	Oct 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Distributed and Uncoordinated Cognitive Radios Resource Allocation	May 27, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
A State Representation for Diminishing Rewards	Sep 7, 2023	Reinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Dynamic Treatment Regimes on Medical Registry Data	Jan 28, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Dynamic Spectrum Sensing and Aggregation in Multi-Channel Wireless Networks	Jul 28, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Reinforcement Learning for Dynamic Spectrum Sharing of LTE and NR	Feb 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
CostNet: An End-to-End Framework for Goal-Directed Reinforcement Learning	Oct 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
Cost-Effective Two-Stage Network Slicing for Edge-Cloud Orchestrated Vehicular Networks	Dec 31, 2022	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
A State Representation Dueling Network for Deep Reinforcement Learning	Dec 24, 2020	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Dynamic Urban Transportation Problems	Jun 14, 2018	Deep LearningDeep Reinforcement Learning	—Unverified
Agent-Agnostic Human-in-the-Loop Reinforcement Learning	Jan 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Electric Vehicle Routing Problem with Time Windows	Oct 5, 2020	Deep Reinforcement LearningGraph Embedding	—Unverified
Deep Reinforcement Learning for Entity Alignment	Nov 16, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Deterministic Value-Policy Gradients	Sep 9, 2019	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning for Equal Risk Pricing and Hedging under Dynamic Expectile Risk Measures	Sep 9, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Load Shedding for Grid Emergency Control via Deep Reinforcement Learning	Feb 25, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A State Augmentation based approach to Reinforcement Learning from Human Preferences	Feb 17, 2023	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 145 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified