Visual Navigation

Visual Navigation is the problem of navigating an agent, e.g. a mobile robot, in an environment using camera input only. The agent is given a target image (an image it will see from the target position), and its goal is to move from its current position to the target by applying a sequence of actions, based on the camera observations only.

Source: Vision-based Navigation Using Deep Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 316 papers

Title	Date	Tasks	Status
MetaCropFollow: Few-Shot Adaptation with Meta-Learning for Under-Canopy Navigation	Nov 21, 2024	Meta-LearningVisual Navigation	—Unverified
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding	Mar 7, 2023	Vision and Language NavigationVisual Navigation	—Unverified
Exploring the Impacts from Datasets to Monocular Depth Estimation (MDE) Models with MineNavi	Aug 19, 2020	Dataset GenerationDepth Estimation	—Unverified
MoDA: Map style transfer for self-supervised Domain Adaptation of embodied agents	Nov 29, 2022	Domain AdaptationStyle Transfer	—Unverified
Adaptive Navigation Scheme for Optimal Deep-Sea Localization Using Multimodal Perception Cues	Jun 12, 2019	Decision MakingPoint Cloud Generation	—Unverified
Moving Forward by Moving Backward: Embedding Action Impact over Action Semantics	Apr 24, 2023	Visual Navigation	—Unverified
MRS-VPR: a multi-resolution sampling based global visual place recognition method	Feb 26, 2019	Loop Closure DetectionVisual Navigation	—Unverified
Gram-SLD: Automatic Self-labeling and Detection for Instance Objects	Dec 7, 2021	Objectobject-detection	—Unverified
Multi-goal Audio-visual Navigation using Sound Direction Map	Aug 1, 2023	Deep Reinforcement LearningNavigate	—Unverified
Multimodal Aggregation Approach for Memory Vision-Voice Indoor Navigation with Meta-Learning	Sep 1, 2020	Meta-LearningVisual Navigation	—Unverified
Multimodal Large Language Model for Visual Navigation	Oct 12, 2023	Language ModelingLanguage Modelling	—Unverified
Multi-View Pedestrian Occupancy Prediction with a Novel Synthetic Dataset	Dec 18, 2024	Pedestrian DetectionScene Understanding	—Unverified
Google Map Aided Visual Navigation for UAVs in GPS-denied Environment	Mar 29, 2017	Optical Flow EstimationPose Tracking	—Unverified
NaRPA: Navigation and Rendering Pipeline for Astronautics	Nov 3, 2022	Visual Navigation	—Unverified
Good Actions Succeed, Bad Actions Generalize: A Case Study on Why RL Generalizes Better	Mar 19, 2025	AttributeReinforcement Learning (RL)	—Unverified
Generating Robust Supervision for Learning-Based Visual Navigation Using Hamilton-Jacobi Reachability	Dec 20, 2019	PredictionVisual Navigation	—Unverified
Navigating to Objects in the Real World	Dec 2, 2022	NavigateVisual Navigation	—Unverified
GAPLE: Generalizable Approaching Policy LEarning for Robotic Object Searching in Indoor Environment	Sep 21, 2018	Semantic SegmentationVisual Navigation	—Unverified
Neural Topological SLAM for Visual Navigation	May 25, 2020	Visual Navigation	—Unverified
Newton-PnP: Real-time Visual Navigation for Autonomous Toy-Drones	Mar 5, 2022	Visual Navigation	—Unverified
Object-Goal Visual Navigation via Effective Exploration of Relations Among Historical Navigation States	Jan 1, 2023	State Estimationvalid	—Unverified
Object-oriented Targets for Visual Navigation using Rich Semantic Representations	Nov 22, 2018	NavigateObject	—Unverified
Visuospatial navigation without distance, prediction, integration, or maps	Jul 18, 2024	Decision MakingNavigate	—Unverified
Omnidirectional Information Gathering for Knowledge Transfer-based Audio-Visual Navigation	Aug 20, 2023	Decision MakingTransfer Learning	—Unverified
Bird's Eye View Based Pretrained World model for Visual Navigation	Oct 28, 2023	NavigateVisual Navigation	—Unverified
From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN)	Feb 26, 2020	BIG-bench Machine LearningVisual Navigation	—Unverified
FloNa: Floor Plan Guided Embodied Visual Navigation	Dec 24, 2024	NavigateVisual Navigation	—Unverified
On Lottery Tickets and Minimal Task Representations in Deep Reinforcement Learning	May 4, 2021	Behavioural cloningDeep Reinforcement Learning	—Unverified
CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual Navigation in Noisy Environments	Jun 6, 2023	Hierarchical Reinforcement LearningNavigate	—Unverified
NOLO: Navigate Only Look Once	Aug 2, 2024	In-Context LearningNavigate	—Unverified
Optimizing Gaze Direction in a Visual Navigation Task	Feb 16, 2016	Visual Navigation	—Unverified
Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features	Oct 16, 2024	Visual Navigation	—Unverified
OVRL-V2: A simple state-of-art baseline for ImageNav and ObjectNav	Mar 14, 2023	object-detectionObject Detection	—Unverified
Pay Self-Attention to Audio-Visual Navigation	Oct 4, 2022	Visual Navigation	—Unverified
Perception and Navigation in Autonomous Systems in the Era of Learning: A Survey	Jan 8, 2020	Autonomous NavigationDecision Making	—Unverified
Perceptual Attention-based Predictive Control	Apr 26, 2019	Model Predictive ControlUncertainty Quantification	—Unverified
Filter-Aware Model-Predictive Control	Apr 20, 2023	modelModel Predictive Control	—Unverified
Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial Observability in Visual Navigation	Jul 27, 2020	Reinforcement Learning (RL)Visual Navigation	—Unverified
Polyline Generative Navigable Space Segmentation for Autonomous Visual Navigation	Oct 29, 2021	Autonomous NavigationRepresentation Learning	—Unverified
Few-Shot Goal Inference for Visuomotor Learning and Planning	Sep 30, 2018	reinforcement-learningReinforcement Learning	—Unverified
Pose Invariant Topological Memory for Visual Navigation	Jan 1, 2021	Contrastive LearningData Augmentation	—Unverified
Predicting Topological Maps for Visual Navigation in Unexplored Environments	Nov 23, 2022	Visual Navigation	—Unverified
Predictive Control Using Learned State Space Models via Rolling Horizon Evolution	Jun 25, 2021	Decision MakingModel-based Reinforcement Learning	—Unverified
Feudal Networks for Visual Navigation	Feb 19, 2024	NavigateVisual Navigation	—Unverified
Fast Traversability Estimation for Wild Visual Navigation	May 15, 2023	NavigateSelf-Supervised Learning	—Unverified
RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation	Feb 4, 2025	Drone navigationReinforcement Learning (RL)	—Unverified
Zero Experience Required: Plug & Play Modular Transfer Learning for Semantic Visual Navigation	Feb 5, 2022	Transfer LearningVisual Navigation	—Unverified
RCA: Ride Comfort-Aware Visual Navigation via Self-Supervised Learning	Jul 29, 2022	Self-Supervised LearningVisual Navigation	—Unverified
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach	Mar 11, 2025	NavigateSequential Decision Making	—Unverified
ReCoRe: Regularized Contrastive Representation Learning of World Model	Dec 14, 2023	Contrastive LearningDenoising	—Unverified

Show:10 25 50

← PrevPage 4 of 7Next →

All datasets Cooperative Vision-and-Dialogue Navigation R2R SOON Test AI2-THOR Dmlab-30 Help, Anna! (HANNA)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NaviLLM	dist_to_end_reduction	7.9	—	Unverified
2	VLN-PETL	dist_to_end_reduction	6.13	—	Unverified
3	early to bed	dist_to_end_reduction	6.03	—	Unverified
4	HAMT	dist_to_end_reduction	5.58	—	Unverified
5	s-agent (NDH-Full)	dist_to_end_reduction	5.27	—	Unverified
6	BabyWalk (r2r-pretrain)	dist_to_end_reduction	4.46	—	Unverified
7	Environment-agnostic Multitask Learning	dist_to_end_reduction	3.91	—	Unverified
8	BabyWalk	dist_to_end_reduction	3.65	—	Unverified
9	Test2-NDH	dist_to_end_reduction	3.44	—	Unverified
10	SCoA	dist_to_end_reduction	3.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SUSA	spl	0.64	—	Unverified
2	Meta-Explore	spl	0.61	—	Unverified
3	NaviLLM	spl	0.6	—	Unverified
4	BEV-BERT	spl	0.6	—	Unverified
5	HOP	spl	0.59	—	Unverified
6	DUET	spl	0.58	—	Unverified
7	VLN-PETL	spl	0.58	—	Unverified
8	VLN-BERT	spl	0.57	—	Unverified
9	Prevalent	spl	0.51	—	Unverified
10	RCM+SIL(no early exploration)	spl	0.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AutoVLN	Nav-SPL	27.83	—	Unverified
2	NaviLLM	Nav-SPL	26.26	—	Unverified
3	Meta-Explore	Nav-SPL	25.8	—	Unverified
4	SUSA	Nav-SPL	25.47	—	Unverified
5	DUET	Nav-SPL	21.42	—	Unverified
6	GBE	Nav-SPL	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVV-IN	SPL (All)	17.27	—	Unverified
2	SAVN	SPL (All)	16.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PopArt-IMPALA	Medium Human-Normalized Score	72.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Prevalent	spl	28.72	—	Unverified