Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9076–9100 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning for Adaptive Caching with Dynamic Storage Pricing	Dec 17, 2018	Decision MakingQ-Learning	—Unverified
Reinforcement Learning for Adaptive Mesh Refinement	Mar 1, 2021	Deep Reinforcement LearningInductive Bias	—Unverified
Reinforcement Learning for Adaptive Video Compressive Sensing	May 18, 2021	Compressive Sensingobject-detection	—Unverified
Reinforcement Learning for a Discrete-Time Linear-Quadratic Control Problem with an Application	Dec 8, 2024	ManagementReinforcement Learning (RL)	—Unverified
Reinforcement learning for Admission Control in 5G Wireless Networks	Apr 13, 2021	Blockingreinforcement-learning	—Unverified
Reinforcement Learning for Admission Control in Wireless Virtual Network Embedding	Oct 4, 2021	Deep Reinforcement LearningNetwork Embedding	—Unverified
Reinforcement Learning for Agile Active Target Sensing with a UAV	Dec 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Aligning Large Language Models Agents with Interactive Environments: Quantifying and Mitigating Prompt Overfitting	Oct 25, 2024	Decision MakingReinforcement Learning (RL)	—Unverified
Reinforcement Learning for AMR Charging Decisions: The Impact of Reward and Action Space Design	May 16, 2025	Reinforcement Learning (RL)	—Unverified
Reinforcement learning for anisotropic p-adaptation and error estimation in high-order solvers	Jul 26, 2024	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning for Assignment problem	Nov 8, 2020	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Assignment Problem with Time Constraints	Jun 5, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Autonomous Defence in Software-Defined Networking	Aug 17, 2018	BIG-bench Machine LearningGeneral Classification	—Unverified
Reinforcement Learning for Autonomous Driving with Latent State Inference and Spatial-Temporal Relationships	Nov 9, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Reinforcement learning for bandwidth estimation and congestion control in real-time communications	Dec 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Battery Energy Storage Dispatch augmented with Model-based Optimizer	Sep 2, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Reinforcement Learning for Beam Pattern Design in Millimeter Wave and Massive MIMO Systems	Feb 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Better Verbalized Confidence in Long-Form Generation	May 29, 2025	FormHallucination	—Unverified
Reinforcement Learning for Block Decomposition of CAD Models	Feb 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Caching with Space-Time Popularity Dynamics	May 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Classical Planning: Viewing Heuristics as Dense Reward Generators	Sep 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Cognitive Delay/Disruption Tolerant Network Node Management in an LEO-based Satellite Constellation	Sep 27, 2022	ManagementReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Combinatorial Optimization: A Survey	Mar 7, 2020	Combinatorial OptimizationDecision Making	—Unverified
Reinforcement Learning for ConnectX	Oct 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Control with Probabilistic Stability Guarantee	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 364 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified