Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6301–6350 of 15113 papers

Title	Date	Tasks	Status
Local Stochastic Approximation: A Unified View of Federated Learning and Distributed Multi-Task Reinforcement Learning Algorithms	Jun 24, 2020	Federated Learningreinforcement-learning	—Unverified
LOCO: Adaptive exploration in reinforcement learning via local estimation of contraction coefficients	Mar 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Logarithmic regret bounds for continuous-time average-reward Markov decision processes	May 23, 2022	Point Processesreinforcement-learning	—Unverified
Logarithmic Regret for Reinforcement Learning with Linear Function Approximation	Nov 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Logarithmic Switching Cost in Reinforcement Learning beyond Linear MDPs	Feb 24, 2023	reinforcement-learningReinforcement Learning	—Unverified
Logical Composition in Lifelong Reinforcement Learning	Jun 12, 2020	Lifelong learningreinforcement-learning	—Unverified
Logic and the 2-Simplicial Transformer	Sep 2, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Logician and Orator: Learning from the Duality between Language and Knowledge in Open Domain	Oct 1, 2018	Open Information Extractionreinforcement-learning	—Unverified
Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers	Sep 16, 2024	Reinforcement Learning (RL)	—Unverified
Logistic Q-Learning	Oct 21, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
LogLLaMA: Transformer-based log anomaly detection with LLaMA	Mar 19, 2025	Anomaly DetectionReinforcement Learning (RL)	—Unverified
Log-normality and Skewness of Estimated State/Action Values in Reinforcement Learning	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Long and Short-Term Constraints Driven Safe Reinforcement Learning for Autonomous Driving	Mar 27, 2024	Autonomous DrivingDecision Making	—Unverified
Longitudinal Deep Truck: Deep learning and deep reinforcement learning for modeling and control of longitudinal dynamics of heavy duty trucks	Sep 28, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Review of Learning-based Longitudinal Motion Planning for Autonomous Vehicles: Research Gaps between Self-driving and Traffic Congestion	Oct 2, 2019	Autonomous VehiclesBIG-bench Machine Learning	—Unverified
Long N-step Surrogate Stage Reward to Reduce Variances of Deep Reinforcement Learning in Complex Problems	Oct 10, 2022	continuous-controlContinuous Control	—Unverified
Long-Range Indoor Navigation with PRM-RL	Feb 25, 2019	Navigatereinforcement-learning	—Unverified
Long Run Incremental Cost (LRIC) Distribution Network Pricing in UK, advising China's Distribution Network	May 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Long-Tail Classification for Distinctive Image Captioning: A Simple yet Effective Remedy for Side Effects of Reinforcement Learning	Jan 16, 2022	Image CaptioningReinforcement Learning (RL)	—Unverified
Long Term Memory Network for Combinatorial Optimization Problems	Jan 1, 2018	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Long-term planning, short-term adjustments	Sep 25, 2019	Deep Reinforcement LearningPrediction	—Unverified
Long-term Safe Reinforcement Learning with Binary Feedback	Jan 8, 2024	reinforcement-learningReinforcement Learning	—Unverified
Look-Ahead AC Optimal Power Flow: A Model-Informed Reinforcement Learning Approach	Mar 4, 2023	Decision Makingreinforcement-learning	—Unverified
The Indoor-Training Effect: unexpected gains from distribution shifts in the transition function	Jan 29, 2024	Atari GamesReinforcement Learning (RL)	—Unverified
Look Before You Leap: Safe Model-Based Reinforcement Learning with Human Intervention	Nov 10, 2021	BlockingDecision Making	—Unverified
Look Closer: Bridging Egocentric and Third-Person Views with Transformers for Robotic Manipulation	Jan 19, 2022	Reinforcement Learning (RL)	—Unverified
Look Harder: A Neural Machine Translation Model with Hard Attention	Jul 1, 2019	Hard AttentionMachine Translation	—Unverified
LoopSR: Looping Sim-and-Real for Lifelong Policy Adaptation of Legged Robots	Sep 26, 2024	Contrastive LearningDecoder	—Unverified
LORD: Large Models based Opposite Reward Design for Autonomous Driving	Mar 27, 2024	Autonomous DrivingImitation Learning	—Unverified
Loss- and Reward-Weighting for Efficient Distributed Reinforcement Learning	Apr 25, 2023	reinforcement-learningReinforcement Learning	—Unverified
Loss Functions for Multiset Prediction	Nov 14, 2017	Decision MakingPrediction	—Unverified
Loss is its own Reward: Self-Supervision for Reinforcement Learning	Dec 21, 2016	reinforcement-learningReinforcement Learning	—Unverified
Loss of Plasticity in Continual Deep Reinforcement Learning	Mar 13, 2023	Atari GamesContinual Learning	—Unverified
Low-Bandwidth Communication Emerges Naturally in Multi-Agent Learning Systems	Nov 30, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Low-Dimensional State and Action Representation Learning with MDP Homomorphism Metrics	Jul 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Low Dimensional State Representation Learning with Robotics Priors in Continuous Action Spaces	Jul 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low Dose CT Denoising via Joint Bilateral Filtering and Intelligent Parameter Optimization	Jul 9, 2020	Deep LearningDeep Reinforcement Learning	—Unverified
Low Dose Helical CBCT denoising by using domain filtering with deep reinforcement learning	Apr 2, 2021	Deep Reinforcement LearningDenoising	—Unverified
Low Emission Building Control with Zero-Shot Reinforcement Learning	Aug 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Low Entropy Communication in Multi-Agent Reinforcement Learning	Feb 10, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Lower Bounds for Learning in Revealing POMDPs	Feb 2, 2023	Reinforcement Learning (RL)	—Unverified
Low Level Control of a Quadrotor with Deep Model-Based Reinforcement Learning	Jan 11, 2019	GPUModel-based Reinforcement Learning	—Unverified
Low-level Pose Control of Tilting Multirotor for Wall Perching Tasks Using Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low-pass Recurrent Neural Networks - A memory architecture for longer-term correlation discovery	May 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Low Precision Policy Distillation with Application to Low-Power, Real-time Sensation-Cognition-Action Loop with Neuromorphic Computing	Sep 25, 2018	Atari Gamesreinforcement-learning	—Unverified
1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities	Mar 19, 2025	Reinforcement Learning (RL)Self-Supervised Learning	—Unverified
Deploying Offline Reinforcement Learning with Human Feedback	Mar 13, 2023	Decision MakingModel Selection	—Unverified
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified
Depth and nonlinearity induce implicit exploration for RL	May 29, 2018	Q-Learningreinforcement-learning	—Unverified
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing	Apr 25, 2025	Decision MakingReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 127 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified