Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11401–11450 of 15113 papers

Title	Date	Tasks	Status
Variational Quantum Soft Actor-Critic for Robotic Arm Control	Dec 20, 2022	continuous-controlContinuous Control	—Unverified
Variational Regret Bounds for Reinforcement Learning	May 14, 2019	General Reinforcement Learningreinforcement-learning	—Unverified
Variational Reward Estimator Bottleneck: Learning Robust Reward Estimator for Multi-Domain Task-Oriented Dialog	May 31, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
VAR-MATH: Probing True Mathematical Reasoning in Large Language Models via Symbolic Multi-Instance Benchmarks	Jul 17, 2025	MathMathematical Reasoning	—Unverified
VASE: Variational Assorted Surprise Exploration for Reinforcement Learning	Oct 31, 2019	continuous-controlContinuous Control	—Unverified
Vehicle Tracking in Wireless Sensor Networks via Deep Reinforcement Learning	Feb 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Vehicle Type Specific Waypoint Generation	Aug 9, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Vehicular Cooperative Perception Through Action Branching and Federated Reinforcement Learning	Dec 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Verifiable Reinforcement Learning Systems via Compositionality	Sep 9, 2023	reinforcement-learningReinforcement Learning	—Unverified
Verification of Dissipativity and Evaluation of Storage Function in Economic Nonlinear MPC using Q-Learning	May 24, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
VerifierQ: Enhancing LLM Test Time Compute with Q-Learning-based Verifiers	Oct 10, 2024	Mathematical ReasoningQ-Learning	—Unverified
VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models	May 21, 2025	BenchmarkingReinforcement Learning (RL)	—Unverified
Versatile Inverse Reinforcement Learning via Cumulative Rewards	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Vessel-following model for inland waterways based on deep reinforcement learning	Jul 7, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
ViaRL: Adaptive Temporal Grounding via Visual Iterated Amplification Reinforcement Learning	May 21, 2025	Pseudo LabelReinforcement Learning (RL)	—Unverified
Video Captioning via Hierarchical Reinforcement Learning	Nov 29, 2017	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Video-Enhanced Offline Reinforcement Learning: A Model-Based Approach	May 10, 2025	Autonomous DrivingOffline RL	—Unverified
Video-RTS: Rethinking Reinforcement Learning and Test-Time Scaling for Efficient and Enhanced Video Reasoning	Jul 9, 2025	Reinforcement Learning (RL)	—Unverified
Video Summarisation by Classification with Deep Reinforcement Learning	Jul 9, 2018	ClassificationDecision Making	—Unverified
Video Summarization through Reinforcement Learning with a 3D Spatio-Temporal U-Net	Jun 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Video Violence Recognition and Localization Using a Semi-Supervised Hard Attention Model	Feb 4, 2022	Activity RecognitionHard Attention	—Unverified
Viewport-Aware Deep Reinforcement Learning Approach for 360^o Video Caching	Mar 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
ViNG: Learning Open-World Navigation with Visual Goals	Dec 17, 2020	Navigatereinforcement-learning	—Unverified
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning	Apr 16, 2025	D4RLOffline RL	—Unverified
Virtual Action Actor-Critic Framework for Exploration (Student Abstract)	Nov 6, 2023	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Virtual Autonomous Driving with Reinforcement Learning	Dec 14, 2020	Autonomous DrivingQ-Learning	—Unverified
Virtual Experience to Real World Application: Sidewalk Obstacle Avoidance Using Reinforcement Learning for Visually Impaired	Sep 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
Virtuously Safe Reinforcement Learning	May 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
ViSaRL: Visual Reinforcement Learning Guided by Human Saliency	Mar 16, 2024	reinforcement-learningReinforcement Learning	—Unverified
Visceral Machines: Reinforcement Learning with Intrinsic Physiological Rewards	May 1, 2019	Navigatereinforcement-learning	—Unverified
Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement Learning	Mar 8, 2021	Atari GamesAutonomous Navigation	—Unverified
Vision-Language Models Provide Promptable Representations for Reinforcement Learning	Feb 5, 2024	Common Sense ReasoningInstruction Following	—Unverified
Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning	Oct 5, 2022	continuous-controlContinuous Control	—Unverified
Visual Comfort Aware-Reinforcement Learning for Depth Adjustment of Stereoscopic 3D Images	Apr 14, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Visual Diagnostics for Deep Reinforcement Learning Policy Development	Sep 14, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
VisualEnv: visual Gym environments with Blender	Nov 15, 2021	OpenAI Gymreinforcement-learning	—Unverified
Visual Explanation using Attention Mechanism in Actor-Critic-based Deep Reinforcement Learning	Mar 6, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
VisualHints: A Visual-Lingual Environment for Multimodal Reinforcement Learning	Oct 26, 2020	Atari Gamesreinforcement-learning	—Unverified
Towards Learning to Imitate from a Single Video Demonstration	Jan 22, 2019	Imitation LearningOne-Shot Learning	—Unverified
Visual Imitation with Reinforcement Learning using Recurrent Siamese Networks	Jan 1, 2021	One-Shot Learningreinforcement-learning	—Unverified
Visualizing the Loss Landscape of Actor Critic Methods with Applications in Inventory Optimization	Sep 4, 2020	continuous-controlContinuous Control	—Unverified
Visual-Policy Learning through Multi-Camera View to Single-Camera View Knowledge Distillation for Robot Manipulation Tasks	Mar 13, 2023	Data AugmentationKnowledge Distillation	—Unverified
Visual processing in context of reinforcement learning	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Visual Radial Basis Q-Network	Jun 14, 2022	Q-LearningReinforcement Learning (RL)	—Unverified
Visual Rationalizations in Deep Reinforcement Learning for Atari Games	Feb 1, 2019	Atari GamesDecision Making	—Unverified
Visual search and recognition for robot task execution and monitoring	Feb 7, 2019	Common Sense ReasoningDeep Reinforcement Learning	—Unverified
Visual Semantic Planning using Deep Successor Representations	May 23, 2017	Imitation LearningReinforcement Learning	—Unverified
Visual Sensor Network Reconfiguration with Deep Reinforcement Learning	Aug 13, 2018	Deep Reinforcement Learningobject-detection	—Unverified
Software Simulation and Visualization of Quantum Multi-Drone Reinforcement Learning	Nov 24, 2022	Multi-agent Reinforcement LearningQuantum Machine Learning	—Unverified
Visual-Tactile Multimodality for Following Deformable Linear Objects Using Reinforcement Learning	Mar 31, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 229 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified