Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7201–7225 of 15113 papers

Title	Date	Tasks	Status
VisualHints: A Visual-Lingual Environment for Multimodal Reinforcement Learning	Oct 26, 2020	Atari Gamesreinforcement-learning	—Unverified
Towards Learning to Imitate from a Single Video Demonstration	Jan 22, 2019	Imitation LearningOne-Shot Learning	—Unverified
Visual Imitation with Reinforcement Learning using Recurrent Siamese Networks	Jan 1, 2021	One-Shot Learningreinforcement-learning	—Unverified
Visualizing the Loss Landscape of Actor Critic Methods with Applications in Inventory Optimization	Sep 4, 2020	continuous-controlContinuous Control	—Unverified
Visual-Policy Learning through Multi-Camera View to Single-Camera View Knowledge Distillation for Robot Manipulation Tasks	Mar 13, 2023	Data AugmentationKnowledge Distillation	—Unverified
Visual processing in context of reinforcement learning	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Visual Radial Basis Q-Network	Jun 14, 2022	Q-LearningReinforcement Learning (RL)	—Unverified
Visual Rationalizations in Deep Reinforcement Learning for Atari Games	Feb 1, 2019	Atari GamesDecision Making	—Unverified
Visual search and recognition for robot task execution and monitoring	Feb 7, 2019	Common Sense ReasoningDeep Reinforcement Learning	—Unverified
Visual Semantic Planning using Deep Successor Representations	May 23, 2017	Imitation LearningReinforcement Learning	—Unverified
Visual Sensor Network Reconfiguration with Deep Reinforcement Learning	Aug 13, 2018	Deep Reinforcement Learningobject-detection	—Unverified
Software Simulation and Visualization of Quantum Multi-Drone Reinforcement Learning	Nov 24, 2022	Multi-agent Reinforcement LearningQuantum Machine Learning	—Unverified
Visual-Tactile Multimodality for Following Deformable Linear Objects Using Reinforcement Learning	Mar 31, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Visual Tracking by means of Deep Reinforcement Learning and an Expert Demonstrator	Sep 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Visuomotor Mechanical Search: Learning to Retrieve Target Objects in Clutter	Aug 13, 2020	Deep Reinforcement LearningObject	—Unverified
ViVa: Video-Trained Value Functions for Guiding Online RL from Diverse Data	Mar 23, 2025	Reinforcement Learning (RL)	—Unverified
Vizarel: A System to Help Better Understand RL Agents	Jul 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
VLMLight: Traffic Signal Control via Vision-Language Meta-Control and Dual-Branch Reasoning	May 26, 2025	Large Language ModelReinforcement Learning (RL)	—Unverified
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making	May 6, 2025	Decision MakingGeneral Knowledge	—Unverified
VLM-RL: A Unified Vision Language Models and Reinforcement Learning Framework for Safe Autonomous Driving	Dec 20, 2024	Autonomous DrivingComputational Efficiency	—Unverified
VLP: Vision-Language Preference Learning for Embodied Manipulation	Feb 17, 2025	Reinforcement Learning (RL)	—Unverified
VL-SAFE: Vision-Language Guided Safety-Aware Reinforcement Learning with World Models for Autonomous Driving	May 22, 2025	Autonomous DrivingReinforcement Learning (RL)	—Unverified
VMAV-C: A Deep Attention-based Reinforcement Learning Algorithm for Model-based Control	Dec 24, 2018	Deep AttentionModel-based Reinforcement Learning	—Unverified
vMFER: Von Mises-Fisher Experience Resampling Based on Uncertainty of Gradient Directions for Policy Improvement	May 14, 2024	Decision MakingReinforcement Learning (RL)	—Unverified
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play	Feb 4, 2025	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 289 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified