Visual Navigation

Visual Navigation is the problem of navigating an agent, e.g. a mobile robot, in an environment using camera input only. The agent is given a target image (an image it will see from the target position), and its goal is to move from its current position to the target by applying a sequence of actions, based on the camera observations only.

Source: Vision-based Navigation Using Deep Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 316 papers

Title	Date	Tasks	Status
LeVERB: Humanoid Whole-Body Control with Latent Vision-Language Instruction	Jun 16, 2025	Instruction FollowingVision-Language-Action	—Unverified
Enhancing Safety of Foundation Models for Visual Navigation through Collision Avoidance via Repulsive Estimation	Jun 4, 2025	Collision AvoidanceVisual Navigation	—Unverified
Learning to Drive Anywhere with Model-Based Reannotation	May 8, 2025	NavigateVisual Navigation	—Unverified
Unreal Robotics Lab: A High-Fidelity Robotics Simulator with Advanced Physics and Rendering	Apr 19, 2025	BenchmarkingDataset Generation	—Unverified
Decision-based AI Visual Navigation for Cardiac Ultrasounds	Apr 16, 2025	Binary ClassificationVisual Navigation	—Unverified
The Composite Visual-Laser Navigation Method Applied in Indoor Poultry Farming Environments	Apr 11, 2025	Visual Navigation	—Unverified
UAS Visual Navigation in Large and Unseen Environments via a Meta Agent	Mar 20, 2025	Incremental LearningMeta Reinforcement Learning	—Unverified
Good Actions Succeed, Bad Actions Generalize: A Case Study on Why RL Generalizes Better	Mar 19, 2025	AttributeReinforcement Learning (RL)	—Unverified
ViVa-SAFELAND: a New Freeware for Safe Validation of Vision-based Navigation in Aerial Vehicles	Mar 18, 2025	NavigateVisual Navigation	—Unverified
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach	Mar 11, 2025	NavigateSequential Decision Making	—Unverified
A Map-free Deep Learning-based Framework for Gate-to-Gate Monocular Visual Navigation aboard Miniaturized Aerial Vehicles	Mar 7, 2025	NavigateVisual Navigation	—Unverified
High-precision visual navigation device calibration method based on collimator	Feb 25, 2025	Camera CalibrationVisual Navigation	—Unverified
Improving Collision-Free Success Rate For Object Goal Visual Navigation Via Two-Stage Training With Collision Prediction	Feb 19, 2025	Collision AvoidanceDeep Reinforcement Learning	—Unverified
RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation	Feb 4, 2025	Drone navigationReinforcement Learning (RL)	—Unverified
VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion	Feb 3, 2025	3DGSreinforcement-learning	—Unverified
Enhancing Feature Tracking Reliability for Visual Navigation using Real-Time Safety Filter	Feb 3, 2025	Pose EstimationSimultaneous Localization and Mapping	—Unverified
Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation	Jan 12, 2025	3D Scene ReconstructionVisual Navigation	—Unverified
UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI	Dec 30, 2024	BenchmarkingReinforcement Learning (RL)	—Unverified
FloNa: Floor Plan Guided Embodied Visual Navigation	Dec 24, 2024	NavigateVisual Navigation	—Unverified
Multi-View Pedestrian Occupancy Prediction with a Novel Synthetic Dataset	Dec 18, 2024	Pedestrian DetectionScene Understanding	—Unverified
MetaCropFollow: Few-Shot Adaptation with Meta-Learning for Under-Canopy Navigation	Nov 21, 2024	Meta-LearningVisual Navigation	—Unverified
Memory Proxy Maps for Visual Navigation	Nov 15, 2024	NavigateVisual Navigation	—Unverified
Grounding Video Models to Actions through Goal Conditioned Exploration	Nov 11, 2024	Action GenerationVisual Navigation	—Unverified
Visual Navigation of Digital Libraries: Retrieval and Classification of Images in the National Library of Norway's Digitised Book Collection	Oct 19, 2024	Classificationimage-classification	CodeCode Available
Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features	Oct 16, 2024	Visual Navigation	—Unverified
RNR-Nav: A Real-World Visual Navigation System Using Renderable Neural Radiance Maps	Oct 8, 2024	Visual LocalizationVisual Navigation	—Unverified
Fast Object Detection with a Machine Learning Edge Device	Oct 5, 2024	Autonomous NavigationCPU	—Unverified
Initialization of Monocular Visual Navigation for Autonomous Agents Using Modified Structure from Small Motion	Sep 24, 2024	Motion EstimationSimultaneous Localization and Mapping	—Unverified
HM3D-OVON: A Dataset and Benchmark for Open-Vocabulary Object Goal Navigation	Sep 22, 2024	NavigateVisual Navigation	—Unverified
Causality-Aware Transformer Networks for Robotic Navigation	Sep 4, 2024	Visual Navigation	—Unverified
Addressing the challenges of loop detection in agricultural environments	Aug 28, 2024	Pose EstimationVisual Navigation	CodeCode Available
NOLO: Navigate Only Look Once	Aug 2, 2024	In-Context LearningNavigate	—Unverified
IN-Sight: Interactive Navigation through Sight	Aug 1, 2024	BenchmarkingNavigate	—Unverified
Visuospatial navigation without distance, prediction, integration, or maps	Jul 18, 2024	Decision MakingNavigate	—Unverified
CAMON: Cooperative Agents for Multi-Object Navigation with LLM-based Conversations	Jun 30, 2024	Visual Navigation	—Unverified
Solving Vision Tasks with Simple Photoreceptors Instead of Cameras	Jun 17, 2024	continuous-controlContinuous Control	—Unverified
RoboHop: Segment-based Topological Map Representation for Open-World Visual Navigation	May 9, 2024	Natural Language QueriesRobot Navigation	—Unverified
Sim2Real Transfer for Audio-Visual Navigation with Frequency-Adaptive Acoustic Field Prediction	May 5, 2024	Data AugmentationNavigate	—Unverified
Motor Focus: Fast Ego-Motion Prediction for Assistive Visual Navigation	Apr 25, 2024	Camera CalibrationMotion Compensation	CodeCode Available
TDANet: Target-Directed Attention Network For Object-Goal Visual Navigation With Zero-Shot Ability	Apr 12, 2024	Deep Reinforcement LearningObject	—Unverified
Separated Attention: An Improved Cycle GAN Based Under Water Image Enhancement Method	Apr 11, 2024	Image Enhancementobject-detection	—Unverified
Wild Visual Navigation: Fast Traversability Learning via Pre-Trained Models and Online Self-Supervision	Apr 10, 2024	NavigateSelf-Supervised Learning	—Unverified
3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching	Apr 1, 2024	Domain AdaptationVisual Navigation	CodeCode Available
OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation	Mar 18, 2024	3D Reconstruction3D Scene Reconstruction	CodeCode Available
TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions	Mar 4, 2024	DecoderRobot Navigation	CodeCode Available
A Landmark-Aware Visual Navigation Dataset	Feb 22, 2024	Representation LearningVisual Navigation	—Unverified
Interpretable Brain-Inspired Representations Improve RL Performance on Visual Navigation Tasks	Feb 19, 2024	Inductive BiasVisual Navigation	—Unverified
Feudal Networks for Visual Navigation	Feb 19, 2024	NavigateVisual Navigation	—Unverified
RILA: Reflective and Imaginative Language Agent for Zero-Shot Semantic Audio-Visual Navigation	Jan 1, 2024	Visual Navigation	—Unverified
World-Map Misalignment Detection for Visual Navigation Systems	Jan 1, 2024	Visual Navigation	CodeCode Available

Show:10 25 50

← PrevPage 3 of 7Next →

All datasets Cooperative Vision-and-Dialogue Navigation R2R SOON Test AI2-THOR Dmlab-30 Help, Anna! (HANNA)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NaviLLM	dist_to_end_reduction	7.9	—	Unverified
2	VLN-PETL	dist_to_end_reduction	6.13	—	Unverified
3	early to bed	dist_to_end_reduction	6.03	—	Unverified
4	HAMT	dist_to_end_reduction	5.58	—	Unverified
5	s-agent (NDH-Full)	dist_to_end_reduction	5.27	—	Unverified
6	BabyWalk (r2r-pretrain)	dist_to_end_reduction	4.46	—	Unverified
7	Environment-agnostic Multitask Learning	dist_to_end_reduction	3.91	—	Unverified
8	BabyWalk	dist_to_end_reduction	3.65	—	Unverified
9	Test2-NDH	dist_to_end_reduction	3.44	—	Unverified
10	SCoA	dist_to_end_reduction	3.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SUSA	spl	0.64	—	Unverified
2	Meta-Explore	spl	0.61	—	Unverified
3	NaviLLM	spl	0.6	—	Unverified
4	BEV-BERT	spl	0.6	—	Unverified
5	HOP	spl	0.59	—	Unverified
6	DUET	spl	0.58	—	Unverified
7	VLN-PETL	spl	0.58	—	Unverified
8	VLN-BERT	spl	0.57	—	Unverified
9	Prevalent	spl	0.51	—	Unverified
10	RCM+SIL(no early exploration)	spl	0.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AutoVLN	Nav-SPL	27.83	—	Unverified
2	NaviLLM	Nav-SPL	26.26	—	Unverified
3	Meta-Explore	Nav-SPL	25.8	—	Unverified
4	SUSA	Nav-SPL	25.47	—	Unverified
5	DUET	Nav-SPL	21.42	—	Unverified
6	GBE	Nav-SPL	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVV-IN	SPL (All)	17.27	—	Unverified
2	SAVN	SPL (All)	16.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PopArt-IMPALA	Medium Human-Normalized Score	72.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Prevalent	spl	28.72	—	Unverified