Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6326–6350 of 15113 papers

Title	Date	Tasks	Status
Look Closer: Bridging Egocentric and Third-Person Views with Transformers for Robotic Manipulation	Jan 19, 2022	Reinforcement Learning (RL)	—Unverified
Look Harder: A Neural Machine Translation Model with Hard Attention	Jul 1, 2019	Hard AttentionMachine Translation	—Unverified
LoopSR: Looping Sim-and-Real for Lifelong Policy Adaptation of Legged Robots	Sep 26, 2024	Contrastive LearningDecoder	—Unverified
LORD: Large Models based Opposite Reward Design for Autonomous Driving	Mar 27, 2024	Autonomous DrivingImitation Learning	—Unverified
Loss- and Reward-Weighting for Efficient Distributed Reinforcement Learning	Apr 25, 2023	reinforcement-learningReinforcement Learning	—Unverified
Loss Functions for Multiset Prediction	Nov 14, 2017	Decision MakingPrediction	—Unverified
Loss is its own Reward: Self-Supervision for Reinforcement Learning	Dec 21, 2016	reinforcement-learningReinforcement Learning	—Unverified
Loss of Plasticity in Continual Deep Reinforcement Learning	Mar 13, 2023	Atari GamesContinual Learning	—Unverified
Low-Bandwidth Communication Emerges Naturally in Multi-Agent Learning Systems	Nov 30, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Low-Dimensional State and Action Representation Learning with MDP Homomorphism Metrics	Jul 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Low Dimensional State Representation Learning with Robotics Priors in Continuous Action Spaces	Jul 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low Dose CT Denoising via Joint Bilateral Filtering and Intelligent Parameter Optimization	Jul 9, 2020	Deep LearningDeep Reinforcement Learning	—Unverified
Low Dose Helical CBCT denoising by using domain filtering with deep reinforcement learning	Apr 2, 2021	Deep Reinforcement LearningDenoising	—Unverified
Low Emission Building Control with Zero-Shot Reinforcement Learning	Aug 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Low Entropy Communication in Multi-Agent Reinforcement Learning	Feb 10, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Lower Bounds for Learning in Revealing POMDPs	Feb 2, 2023	Reinforcement Learning (RL)	—Unverified
Low Level Control of a Quadrotor with Deep Model-Based Reinforcement Learning	Jan 11, 2019	GPUModel-based Reinforcement Learning	—Unverified
Low-level Pose Control of Tilting Multirotor for Wall Perching Tasks Using Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low-pass Recurrent Neural Networks - A memory architecture for longer-term correlation discovery	May 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Low Precision Policy Distillation with Application to Low-Power, Real-time Sensation-Cognition-Action Loop with Neuromorphic Computing	Sep 25, 2018	Atari Gamesreinforcement-learning	—Unverified
1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities	Mar 19, 2025	Reinforcement Learning (RL)Self-Supervised Learning	—Unverified
Deploying Offline Reinforcement Learning with Human Feedback	Mar 13, 2023	Decision MakingModel Selection	—Unverified
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified
Depth and nonlinearity induce implicit exploration for RL	May 29, 2018	Q-Learningreinforcement-learning	—Unverified
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing	Apr 25, 2025	Decision MakingReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 254 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified