Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6301–6325 of 15113 papers

Title	Date	Tasks	Status
Local Stochastic Approximation: A Unified View of Federated Learning and Distributed Multi-Task Reinforcement Learning Algorithms	Jun 24, 2020	Federated Learningreinforcement-learning	—Unverified
LOCO: Adaptive exploration in reinforcement learning via local estimation of contraction coefficients	Mar 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Logarithmic regret bounds for continuous-time average-reward Markov decision processes	May 23, 2022	Point Processesreinforcement-learning	—Unverified
Logarithmic Regret for Reinforcement Learning with Linear Function Approximation	Nov 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Logarithmic Switching Cost in Reinforcement Learning beyond Linear MDPs	Feb 24, 2023	reinforcement-learningReinforcement Learning	—Unverified
Logical Composition in Lifelong Reinforcement Learning	Jun 12, 2020	Lifelong learningreinforcement-learning	—Unverified
Logic and the 2-Simplicial Transformer	Sep 2, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Logician and Orator: Learning from the Duality between Language and Knowledge in Open Domain	Oct 1, 2018	Open Information Extractionreinforcement-learning	—Unverified
Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers	Sep 16, 2024	Reinforcement Learning (RL)	—Unverified
Logistic Q-Learning	Oct 21, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
LogLLaMA: Transformer-based log anomaly detection with LLaMA	Mar 19, 2025	Anomaly DetectionReinforcement Learning (RL)	—Unverified
Log-normality and Skewness of Estimated State/Action Values in Reinforcement Learning	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Long and Short-Term Constraints Driven Safe Reinforcement Learning for Autonomous Driving	Mar 27, 2024	Autonomous DrivingDecision Making	—Unverified
Longitudinal Deep Truck: Deep learning and deep reinforcement learning for modeling and control of longitudinal dynamics of heavy duty trucks	Sep 28, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Review of Learning-based Longitudinal Motion Planning for Autonomous Vehicles: Research Gaps between Self-driving and Traffic Congestion	Oct 2, 2019	Autonomous VehiclesBIG-bench Machine Learning	—Unverified
Long N-step Surrogate Stage Reward to Reduce Variances of Deep Reinforcement Learning in Complex Problems	Oct 10, 2022	continuous-controlContinuous Control	—Unverified
Long-Range Indoor Navigation with PRM-RL	Feb 25, 2019	Navigatereinforcement-learning	—Unverified
Long Run Incremental Cost (LRIC) Distribution Network Pricing in UK, advising China's Distribution Network	May 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Long-Tail Classification for Distinctive Image Captioning: A Simple yet Effective Remedy for Side Effects of Reinforcement Learning	Jan 16, 2022	Image CaptioningReinforcement Learning (RL)	—Unverified
Long Term Memory Network for Combinatorial Optimization Problems	Jan 1, 2018	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Long-term planning, short-term adjustments	Sep 25, 2019	Deep Reinforcement LearningPrediction	—Unverified
Long-term Safe Reinforcement Learning with Binary Feedback	Jan 8, 2024	reinforcement-learningReinforcement Learning	—Unverified
Look-Ahead AC Optimal Power Flow: A Model-Informed Reinforcement Learning Approach	Mar 4, 2023	Decision Makingreinforcement-learning	—Unverified
The Indoor-Training Effect: unexpected gains from distribution shifts in the transition function	Jan 29, 2024	Atari GamesReinforcement Learning (RL)	—Unverified
Look Before You Leap: Safe Model-Based Reinforcement Learning with Human Intervention	Nov 10, 2021	BlockingDecision Making	—Unverified

Show:10 25 50

← PrevPage 253 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified