Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7176–7200 of 15113 papers

Title	Date	Tasks	Status
Versatile Inverse Reinforcement Learning via Cumulative Rewards	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Vessel-following model for inland waterways based on deep reinforcement learning	Jul 7, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
ViaRL: Adaptive Temporal Grounding via Visual Iterated Amplification Reinforcement Learning	May 21, 2025	Pseudo LabelReinforcement Learning (RL)	—Unverified
Video Captioning via Hierarchical Reinforcement Learning	Nov 29, 2017	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Video-Enhanced Offline Reinforcement Learning: A Model-Based Approach	May 10, 2025	Autonomous DrivingOffline RL	—Unverified
Video-RTS: Rethinking Reinforcement Learning and Test-Time Scaling for Efficient and Enhanced Video Reasoning	Jul 9, 2025	Reinforcement Learning (RL)	—Unverified
Video Summarisation by Classification with Deep Reinforcement Learning	Jul 9, 2018	ClassificationDecision Making	—Unverified
Video Summarization through Reinforcement Learning with a 3D Spatio-Temporal U-Net	Jun 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Video Violence Recognition and Localization Using a Semi-Supervised Hard Attention Model	Feb 4, 2022	Activity RecognitionHard Attention	—Unverified
Viewport-Aware Deep Reinforcement Learning Approach for 360^o Video Caching	Mar 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
ViNG: Learning Open-World Navigation with Visual Goals	Dec 17, 2020	Navigatereinforcement-learning	—Unverified
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning	Apr 16, 2025	D4RLOffline RL	—Unverified
Virtual Action Actor-Critic Framework for Exploration (Student Abstract)	Nov 6, 2023	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Virtual Autonomous Driving with Reinforcement Learning	Dec 14, 2020	Autonomous DrivingQ-Learning	—Unverified
Virtual Experience to Real World Application: Sidewalk Obstacle Avoidance Using Reinforcement Learning for Visually Impaired	Sep 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
Virtuously Safe Reinforcement Learning	May 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
ViSaRL: Visual Reinforcement Learning Guided by Human Saliency	Mar 16, 2024	reinforcement-learningReinforcement Learning	—Unverified
Visceral Machines: Reinforcement Learning with Intrinsic Physiological Rewards	May 1, 2019	Navigatereinforcement-learning	—Unverified
Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement Learning	Mar 8, 2021	Atari GamesAutonomous Navigation	—Unverified
Vision-Language Models Provide Promptable Representations for Reinforcement Learning	Feb 5, 2024	Common Sense ReasoningInstruction Following	—Unverified
Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning	Oct 5, 2022	continuous-controlContinuous Control	—Unverified
Visual Comfort Aware-Reinforcement Learning for Depth Adjustment of Stereoscopic 3D Images	Apr 14, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Visual Diagnostics for Deep Reinforcement Learning Policy Development	Sep 14, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
VisualEnv: visual Gym environments with Blender	Nov 15, 2021	OpenAI Gymreinforcement-learning	—Unverified
Visual Explanation using Attention Mechanism in Actor-Critic-based Deep Reinforcement Learning	Mar 6, 2021	Decision MakingDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 288 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified