Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4801–4825 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning-Enabled Decision-Making Strategies for a Vehicle-Cyber-Physical-System in Connected Environment	Jul 16, 2020	Autonomous VehiclesDecision Making	—Unverified
Reinforcement Learning-Enabled Reliable Wireless Sensor Networks in Dynamic Underground Environments	Oct 26, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning-enabled Satellite Constellation Reconfiguration and Retasking for Mission-Critical Applications	Sep 3, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Enhanced Explainer for Graph Neural Networks	Dec 1, 2021	Combinatorial OptimizationGraph Generation	—Unverified
Reinforcement learning-enhanced genetic algorithm for wind farm layout optimization	Nov 24, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning-Enhanced Procedural Generation for Dynamic Narrative-Driven AR Experiences	Jan 15, 2025	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Environment with LLM-Controlled Adversary in D&D 5th Edition Combat	Mar 19, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
Reinforcement Learning Experience Reuse with Policy Residual Representation	May 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Finetunes Small Subnetworks in Large Language Models	May 16, 2025	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Active Matter	Mar 30, 2025	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Adaptive Caching with Dynamic Storage Pricing	Dec 17, 2018	Decision MakingQ-Learning	—Unverified
Reinforcement Learning for Adaptive Mesh Refinement	Mar 1, 2021	Deep Reinforcement LearningInductive Bias	—Unverified
Reinforcement Learning for Adaptive Video Compressive Sensing	May 18, 2021	Compressive Sensingobject-detection	—Unverified
Reinforcement Learning for a Discrete-Time Linear-Quadratic Control Problem with an Application	Dec 8, 2024	ManagementReinforcement Learning (RL)	—Unverified
Reinforcement learning for Admission Control in 5G Wireless Networks	Apr 13, 2021	Blockingreinforcement-learning	—Unverified
Reinforcement Learning for Admission Control in Wireless Virtual Network Embedding	Oct 4, 2021	Deep Reinforcement LearningNetwork Embedding	—Unverified
Reinforcement Learning for Agile Active Target Sensing with a UAV	Dec 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Aligning Large Language Models Agents with Interactive Environments: Quantifying and Mitigating Prompt Overfitting	Oct 25, 2024	Decision MakingReinforcement Learning (RL)	—Unverified
Reinforcement Learning for AMR Charging Decisions: The Impact of Reward and Action Space Design	May 16, 2025	Reinforcement Learning (RL)	—Unverified
Reinforcement learning for anisotropic p-adaptation and error estimation in high-order solvers	Jul 26, 2024	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning for Assignment problem	Nov 8, 2020	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Assignment Problem with Time Constraints	Jun 5, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Autonomous Defence in Software-Defined Networking	Aug 17, 2018	BIG-bench Machine LearningGeneral Classification	—Unverified
Reinforcement Learning for Autonomous Driving with Latent State Inference and Spatial-Temporal Relationships	Nov 9, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Reinforcement learning for bandwidth estimation and congestion control in real-time communications	Dec 4, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 193 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified