Visual Navigation

Visual Navigation is the problem of navigating an agent, e.g. a mobile robot, in an environment using camera input only. The agent is given a target image (an image it will see from the target position), and its goal is to move from its current position to the target by applying a sequence of actions, based on the camera observations only.

Source: Vision-based Navigation Using Deep Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 316 papers

Title	Date	Tasks	Status	Score
Drone Path-Following in GPS-Denied Environments using Convolutional Networks	May 5, 2019	Data AugmentationDrone navigation	CodeCode Available	5
Addressing the challenges of loop detection in agricultural environments	Aug 28, 2024	Pose EstimationVisual Navigation	CodeCode Available	5
Zero-Shot Object Goal Visual Navigation With Class-Independent Relationship Network	Oct 15, 2023	ObjectSemantic Similarity	CodeCode Available	5
World-Map Misalignment Detection for Visual Navigation Systems	Jan 1, 2024	Visual Navigation	CodeCode Available	5
What you see is what you get: Experience ranking with deep neural dataset-to-dataset similarity for topological localisation	Oct 20, 2023	Visual Navigation	CodeCode Available	5
3D Visual Perception for Self-Driving Cars using a Multi-Camera System: Calibration, Mapping, Localization, and Obstacle Detection	Aug 31, 2017	Camera CalibrationSelf-Driving Cars	CodeCode Available	5
Visual Navigation of Digital Libraries: Retrieval and Classification of Images in the National Library of Norway's Digitised Book Collection	Oct 19, 2024	Classificationimage-classification	CodeCode Available	5
Visual Pre-training for Navigation: What Can We Learn from Noise?	Jun 30, 2022	Inductive BiasNavigate	CodeCode Available	5
NeoNav: Improving the Generalization of Visual Navigation via Generating Next Expected Observations	Jun 17, 2019	Visual Navigation	CodeCode Available	5
Visual Representations for Semantic Target Driven Navigation	May 15, 2018	Domain AdaptationVisual Navigation	CodeCode Available	5
Contrastive Learning for Image Registration in Visual Teach and Repeat Navigation	Apr 13, 2022	Contrastive LearningImage Registration	CodeCode Available	5
VLN-PETL: Parameter-Efficient Transfer Learning for Vision-and-Language Navigation	Aug 20, 2023	Transfer LearningVision and Language Navigation	CodeCode Available	5
Help, Anna! Visual Navigation with Natural Multimodal Assistance via Retrospective Curiosity-Encouraging Imitation Learning	Sep 4, 2019	Decision MakingImitation Learning	CodeCode Available	5
Vision-based Navigation Using Deep Reinforcement Learning	Aug 8, 2019	Deep Reinforcement LearningEfficient Neural Network	CodeCode Available	5
Good Time to Ask: A Learning Framework for Asking for Help in Embodied Visual Navigation	Jun 20, 2022	Visual Navigation	CodeCode Available	5
Imitation Learning with Human Eye Gaze via Multi-Objective Prediction	Feb 25, 2021	Continuous ControlImitation Learning	CodeCode Available	5
A Hybrid Compact Neural Architecture for Visual Place Recognition	Oct 15, 2019	Autonomous DrivingAutonomous Navigation	CodeCode Available	5
Towards Disturbance-Free Visual Mobile Manipulation	Dec 17, 2021	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available	5
The Regretful Agent: Heuristic-Aided Navigation through Progress Estimation	Mar 5, 2019	Decision MakingVision and Language Navigation	CodeCode Available	5
The Regretful Navigation Agent for Vision-and-Language Navigation	Mar 5, 2019	Decision MakingVision and Language Navigation	CodeCode Available	5
Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning	Sep 16, 2016	3D ReconstructionDeep Reinforcement Learning	CodeCode Available	5
SplitNet: Sim2Sim and Task2Task Transfer for Embodied Visual Navigation	May 18, 2019	Visual Navigation	CodeCode Available	5
Bayesian Relational Memory for Semantic Visual Navigation	Sep 10, 2019	NavigateVisual Navigation	CodeCode Available	5
SeanNet: Semantic Understanding Network for Localization Under Object Dynamics	Oct 5, 2021	Contrastive LearningObject	CodeCode Available	5
Scaling and Benchmarking Self-Supervised Visual Representation Learning	May 3, 2019	Benchmarkingobject-detection	CodeCode Available	5
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	5
On the Performance of ConvNet Features for Place Recognition	Jan 17, 2015	Visual Navigation	CodeCode Available	5
See What the Robot Can't See: Learning Cooperative Perception for Visual Navigation	Aug 1, 2022	Graph Neural NetworkImitation Learning	CodeCode Available	5
OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation	Mar 18, 2024	3D Reconstruction3D Scene Reconstruction	CodeCode Available	5
On Embodied Visual Navigation in Real Environments Through Habitat	Oct 26, 2020	Domain AdaptationUnsupervised Domain Adaptation	CodeCode Available	5
3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching	Apr 1, 2024	Domain AdaptationVisual Navigation	CodeCode Available	5
Motor Focus: Fast Ego-Motion Prediction for Assistive Visual Navigation	Apr 25, 2024	Camera CalibrationMotion Compensation	CodeCode Available	5
RARA: Zero-shot Sim2Real Visual Navigation with Following Foreground Cues	Jan 8, 2022	TripletVisual Navigation	CodeCode Available	5
TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions	Mar 4, 2024	DecoderRobot Navigation	CodeCode Available	5
Learning Efficient Multi-Agent Cooperative Visual Exploration	Oct 12, 2021	Reinforcement Learning (RL)Visual Navigation	—Unverified	0
ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion	Feb 9, 2023	Question AnsweringVisual Navigation	—Unverified	0
Learning a State Representation and Navigation in Cluttered and Dynamic Environments	Mar 7, 2021	Representation LearningVisual Navigation	—Unverified	0
Learning and Planning with a Semantic Model	Sep 28, 2018	Deep Reinforcement Learningmodel	—Unverified	0
DRISHTI: Visual Navigation Assistant for Visually Impaired	Mar 13, 2023	Visual Navigation	—Unverified	0
Learned Visual Navigation for Under-Canopy Agricultural Robots	Jul 6, 2021	Autonomous NavigationModel Predictive Control	—Unverified	0
Learned Camera Gain and Exposure Control for Improved Visual Feature Detection and Matching	Feb 8, 2021	Simultaneous Localization and MappingVisual Navigation	—Unverified	0
Differentiable SLAM-net: Learning Particle SLAM for Visual Navigation	May 17, 2021	Robot NavigationSimultaneous Localization and Mapping	—Unverified	0
Knowledge-driven Scene Priors for Semantic Audio-Visual Embodied Navigation	Dec 21, 2022	Visual Navigation	—Unverified	0
Invariance is Key to Generalization: Examining the Role of Representation in Sim-to-Real Transfer for Visual Navigation	Oct 23, 2023	Visual Navigation	—Unverified	0
Interpretable Brain-Inspired Representations Improve RL Performance on Visual Navigation Tasks	Feb 19, 2024	Inductive BiasVisual Navigation	—Unverified	0
Integrating Symmetry into Differentiable Planning with Steerable Convolutions	Jun 8, 2022	Decision MakingVisual Navigation	—Unverified	0
DeepRelativeFusion: Dense Monocular SLAM using Single-Image Relative Depth Prediction	Jun 7, 2020	Depth EstimationDepth Prediction	—Unverified	0
Instance-Specific Image Goal Navigation: Training Embodied Agents to Find Object Instances	Nov 29, 2022	Visual Navigation	—Unverified	0
Initialization of Monocular Visual Navigation for Autonomous Agents Using Modified Structure from Small Motion	Sep 24, 2024	Motion EstimationSimultaneous Localization and Mapping	—Unverified	0
Deep Learning for Visual Navigation of Underwater Robots	Oct 30, 2023	Deep LearningImitation Learning	—Unverified	0

Show:10 25 50

← PrevPage 3 of 7Next →

All datasets Cooperative Vision-and-Dialogue Navigation R2R SOON Test AI2-THOR Dmlab-30 Help, Anna! (HANNA)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NaviLLM	dist_to_end_reduction	7.9	—	Unverified
2	VLN-PETL	dist_to_end_reduction	6.13	—	Unverified
3	early to bed	dist_to_end_reduction	6.03	—	Unverified
4	HAMT	dist_to_end_reduction	5.58	—	Unverified
5	s-agent (NDH-Full)	dist_to_end_reduction	5.27	—	Unverified
6	BabyWalk (r2r-pretrain)	dist_to_end_reduction	4.46	—	Unverified
7	Environment-agnostic Multitask Learning	dist_to_end_reduction	3.91	—	Unverified
8	BabyWalk	dist_to_end_reduction	3.65	—	Unverified
9	Test2-NDH	dist_to_end_reduction	3.44	—	Unverified
10	SCoA	dist_to_end_reduction	3.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SUSA	spl	0.64	—	Unverified
2	Meta-Explore	spl	0.61	—	Unverified
3	NaviLLM	spl	0.6	—	Unverified
4	BEV-BERT	spl	0.6	—	Unverified
5	HOP	spl	0.59	—	Unverified
6	DUET	spl	0.58	—	Unverified
7	VLN-PETL	spl	0.58	—	Unverified
8	VLN-BERT	spl	0.57	—	Unverified
9	Prevalent	spl	0.51	—	Unverified
10	RCM+SIL(no early exploration)	spl	0.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AutoVLN	Nav-SPL	27.83	—	Unverified
2	NaviLLM	Nav-SPL	26.26	—	Unverified
3	Meta-Explore	Nav-SPL	25.8	—	Unverified
4	SUSA	Nav-SPL	25.47	—	Unverified
5	DUET	Nav-SPL	21.42	—	Unverified
6	GBE	Nav-SPL	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVV-IN	SPL (All)	17.27	—	Unverified
2	SAVN	SPL (All)	16.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PopArt-IMPALA	Medium Human-Normalized Score	72.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Prevalent	spl	28.72	—	Unverified