Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6651–6700 of 15113 papers

Title	Date	Tasks	Status
DQN-based Beamforming for Uplink mmWave Cellular-Connected UAVs	Oct 12, 2021	Reinforcement Learning (RL)	—Unverified
DQN with model-based exploration: efficient learning on environments with sparse rewards	Mar 22, 2019	Atari GamesOpenAI Gym	—Unverified
DR2L: Surfacing Corner Cases to Robustify Autonomous Driving via Domain Randomization Reinforcement Learning	Jul 25, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization	Dec 9, 2021	Atari GamesD4RL	—Unverified
DRAS-CQSim: A Reinforcement Learning based Framework for HPC Cluster Scheduling	May 16, 2021	reinforcement-learningReinforcement Learning	—Unverified
Drawing Inductor Layout with a Reinforcement Learning Agent: Method and Application for VCO Inductors	Feb 23, 2022	Reinforcement Learning (RL)	—Unverified
DRDT3: Diffusion-Refined Decision Test-Time Training Model	Jan 12, 2025	D4RLOffline RL	—Unverified
DREAM: Adaptive Reinforcement Learning based on Attention Mechanism for Temporal Knowledge Graph Reasoning	Apr 8, 2023	Knowledge GraphsMissing Elements	—Unverified
DREAM Architecture: a Developmental Approach to Open-Ended Learning in Robotics	May 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
DreamerV3 for Traffic Signal Control: Hyperparameter Tuning and Performance	Mar 4, 2025	Reinforcement Learning (RL)Traffic Signal Control	—Unverified
Dreaming machine learning: Lipschitz extensions for reinforcement learning on financial markets	Jul 9, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified
Dreaming: Model-based Reinforcement Learning by Latent Imagination without Reconstruction	Jul 29, 2020	Contrastive LearningData Augmentation	—Unverified
DreamingV2: Reinforcement Learning with Discrete World Models without Reconstruction	Mar 1, 2022	Contrastive LearningModel-based Reinforcement Learning	—Unverified
DRIFT: Deep Reinforcement Learning for Functional Software Testing	Jul 16, 2020	Deep Reinforcement LearningGraph Neural Network	—Unverified
DRILL-- Deep Reinforcement Learning for Refinement Operators in ALC	Jun 29, 2021	Deep Reinforcement LearningKnowledge Graphs	—Unverified
DriveMind: A Dual-VLM based Reinforcement Learning Framework for Autonomous Driving	Jun 1, 2025	Autonomous DrivingDecoder	—Unverified
Driver Assistance Eco-driving and Transmission Control with Deep Reinforcement Learning	Dec 15, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
DriverGym: Democratising Reinforcement Learning for Autonomous Driving	Nov 12, 2021	Autonomous DrivingOpenAI Gym	—Unverified
Driver Modeling through Deep Reinforcement Learning and Behavioral Game Theory	Mar 24, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Driving Decision and Control for Autonomous Lane Change based on Deep Reinforcement Learning	Apr 23, 2019	Autonomous DrivingDecision Making	—Unverified
Driving in Real Life with Inverse Reinforcement Learning	Jun 7, 2022	Autonomous DrivingImitation Learning	—Unverified
Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using Reinforcement Learning	Dec 2, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
Driving Tasks Transfer in Deep Reinforcement Learning for Decision-making of Autonomous Vehicles	Sep 7, 2020	Autonomous VehiclesDecision Making	—Unverified
Driving with Style: Inverse Reinforcement Learning in General-Purpose Planning for Automated Driving	May 1, 2019	Motion Planningreinforcement-learning	—Unverified
DRL-Based QoS-Aware Resource Allocation Scheme for Coexistence of Licensed and Unlicensed Users in LTE and Beyond	Aug 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
DRL-based Slice Placement Under Non-Stationary Conditions	Aug 5, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
DRL-based Slice Placement under Realistic Network Load Conditions	Sep 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
DRL-Clusters: Buffer Management with Clustering based Deep Reinforcement Learning	Oct 3, 2021	ClusteringDeep Reinforcement Learning	—Unverified
Beyond Sparse Rewards: Enhancing Reinforcement Learning with Language Model Critique in Text Generation	Jan 14, 2024	Language ModelingLanguage Modelling	—Unverified
DRL: Deep Reinforcement Learning for Intelligent Robot Control -- Concept, Literature, and Future	Apr 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
DRL-FAS: A Novel Framework Based on Deep Reinforcement Learning for Face Anti-Spoofing	Sep 16, 2020	Deep Reinforcement LearningFace Anti-Spoofing	—Unverified
DRL-ISP: Multi-Objective Camera ISP with Deep Reinforcement Learning	Jul 7, 2022	2D Object DetectionDeep Reinforcement Learning	—Unverified
DR-MPC: Deep Residual Model Predictive Control for Real-world Social Navigation	Oct 14, 2024	Deep Reinforcement LearningModel Predictive Control	—Unverified
DROP: Distributional and Regular Optimism and Pessimism for Reinforcement Learning	Oct 22, 2024	Ensemble Learningreinforcement-learning	—Unverified
DSADF: Thinking Fast and Slow for Decision Making	May 13, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
DSDF: An approach to handle stochastic agents in collaborative multi-agent reinforcement learning	Sep 14, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
DSDF: Coordinated look-ahead strategy in stochastic multi-agent reinforcement learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
D-Shape: Demonstration-Shaped Reinforcement Learning via Goal Conditioning	Oct 26, 2022	Imitation Learningreinforcement-learning	—Unverified
DSP: A Differential Spatial Prediction Scheme for Comprehensive real industrial datasets	Aug 23, 2020	Deep Reinforcement LearningPrediction	—Unverified
Dual Active Learning for Reinforcement Learning from Human Feedback	Oct 3, 2024	Active Learningreinforcement-learning	—Unverified
Dual-Agent Deep Reinforcement Learning for Deformable Face Tracking	Sep 1, 2018	Deep Reinforcement LearningFacial Landmark Detection	—Unverified
Dual Behavior Regularized Reinforcement Learning	Sep 19, 2021	counterfactualreinforcement-learning	—Unverified
Dual Control for Approximate Bayesian Reinforcement Learning	Oct 13, 2015	regressionreinforcement-learning	—Unverified
Dual Ensemble Kalman Filter for Stochastic Optimal Control	Apr 10, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
Dual-Objective Reinforcement Learning with Novel Hamilton-Jacobi-Bellman Formulations	Jun 19, 2025	Reinforcement Learning (RL)	—Unverified
Dueling Deep Q Network for Highway Decision Making in Autonomous Vehicles: A Case Study	Jul 16, 2020	Autonomous VehiclesDecision Making	—Unverified
Dueling RL: Reinforcement Learning with Trajectory Preferences	Nov 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
DyFEn: Agent-Based Fee Setting in Payment Channel Networks	Oct 15, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified
Dynamical Distance Learning for Semi-Supervised and Unsupervised Skill Discovery	Jul 18, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 134 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified