Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6676–6700 of 15113 papers

Title	Date	Tasks	Status
DRL-based Slice Placement Under Non-Stationary Conditions	Aug 5, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
DRL-based Slice Placement under Realistic Network Load Conditions	Sep 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
DRL-Clusters: Buffer Management with Clustering based Deep Reinforcement Learning	Oct 3, 2021	ClusteringDeep Reinforcement Learning	—Unverified
Beyond Sparse Rewards: Enhancing Reinforcement Learning with Language Model Critique in Text Generation	Jan 14, 2024	Language ModelingLanguage Modelling	—Unverified
DRL: Deep Reinforcement Learning for Intelligent Robot Control -- Concept, Literature, and Future	Apr 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
DRL-FAS: A Novel Framework Based on Deep Reinforcement Learning for Face Anti-Spoofing	Sep 16, 2020	Deep Reinforcement LearningFace Anti-Spoofing	—Unverified
DRL-ISP: Multi-Objective Camera ISP with Deep Reinforcement Learning	Jul 7, 2022	2D Object DetectionDeep Reinforcement Learning	—Unverified
DR-MPC: Deep Residual Model Predictive Control for Real-world Social Navigation	Oct 14, 2024	Deep Reinforcement LearningModel Predictive Control	—Unverified
DROP: Distributional and Regular Optimism and Pessimism for Reinforcement Learning	Oct 22, 2024	Ensemble Learningreinforcement-learning	—Unverified
DSADF: Thinking Fast and Slow for Decision Making	May 13, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
DSDF: An approach to handle stochastic agents in collaborative multi-agent reinforcement learning	Sep 14, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
DSDF: Coordinated look-ahead strategy in stochastic multi-agent reinforcement learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
D-Shape: Demonstration-Shaped Reinforcement Learning via Goal Conditioning	Oct 26, 2022	Imitation Learningreinforcement-learning	—Unverified
DSP: A Differential Spatial Prediction Scheme for Comprehensive real industrial datasets	Aug 23, 2020	Deep Reinforcement LearningPrediction	—Unverified
Dual Active Learning for Reinforcement Learning from Human Feedback	Oct 3, 2024	Active Learningreinforcement-learning	—Unverified
Dual-Agent Deep Reinforcement Learning for Deformable Face Tracking	Sep 1, 2018	Deep Reinforcement LearningFacial Landmark Detection	—Unverified
Dual Behavior Regularized Reinforcement Learning	Sep 19, 2021	counterfactualreinforcement-learning	—Unverified
Dual Control for Approximate Bayesian Reinforcement Learning	Oct 13, 2015	regressionreinforcement-learning	—Unverified
Dual Ensemble Kalman Filter for Stochastic Optimal Control	Apr 10, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
Dual-Objective Reinforcement Learning with Novel Hamilton-Jacobi-Bellman Formulations	Jun 19, 2025	Reinforcement Learning (RL)	—Unverified
Dueling Deep Q Network for Highway Decision Making in Autonomous Vehicles: A Case Study	Jul 16, 2020	Autonomous VehiclesDecision Making	—Unverified
Dueling RL: Reinforcement Learning with Trajectory Preferences	Nov 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
DyFEn: Agent-Based Fee Setting in Payment Channel Networks	Oct 15, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified
Dynamical Distance Learning for Semi-Supervised and Unsupervised Skill Discovery	Jul 18, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 268 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified