Visual Navigation

Visual Navigation is the problem of navigating an agent, e.g. a mobile robot, in an environment using camera input only. The agent is given a target image (an image it will see from the target position), and its goal is to move from its current position to the target by applying a sequence of actions, based on the camera observations only.

Source: Vision-based Navigation Using Deep Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 316 papers

Title	Date	Tasks	Status	Hype
HOP: History-and-Order Aware Pre-training for Vision-and-Language Navigation	Mar 22, 2022	Decision MakingLanguage Modeling	CodeCode Available	1
Sound Adversarial Audio-Visual Navigation	Feb 22, 2022	NavigateVisual Navigation	CodeCode Available	1
Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds	Nov 29, 2021	NavigateVisual Navigation	CodeCode Available	1
Goal-Aware Cross-Entropy for Multi-Target Reinforcement Learning	Oct 25, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
SGoLAM: Simultaneous Goal Localization and Mapping for Multi-Object Goal Navigation	Oct 14, 2021	NavigateVisual Navigation	CodeCode Available	1
Waypoint Models for Instruction-guided Navigation in Continuous Environments	Oct 5, 2021	Instruction FollowingVisual Navigation	CodeCode Available	1
Towards Autonomous Crop-Agnostic Visual Navigation in Arable Fields	Sep 24, 2021	Autonomous NavigationManagement	CodeCode Available	1
Towards real-world navigation with deep differentiable planners	Aug 8, 2021	Imitation LearningMotion Planning	CodeCode Available	1
Teaching Agents how to Map: Spatial Reasoning for Multi-Object Navigation	Jul 13, 2021	Reinforcement Learning (RL)Spatial Reasoning	CodeCode Available	1
Collaborative Visual Navigation	Jul 2, 2021	Multi-agent Reinforcement LearningNavigate	CodeCode Available	1
RobustNav: Towards Benchmarking Robustness in Embodied Navigation	Jun 8, 2021	BenchmarkingData Augmentation	CodeCode Available	1
Out of the Box: Embodied Navigation in the Real World	May 12, 2021	PointGoal NavigationVisual Navigation	CodeCode Available	1
Pushing it out of the Way: Interactive Visual Navigation	Apr 28, 2021	NavigateVisual Navigation	CodeCode Available	1
Visual Navigation with Spatial Attention	Apr 20, 2021	NavigateObject	CodeCode Available	1
SOON: Scenario Oriented Object Navigation with Graph-based Exploration	Mar 31, 2021	AttributeNavigate	CodeCode Available	1
Simultaneous Navigation and Construction Benchmarking Environments	Mar 31, 2021	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
A Pose-only Solution to Visual Reconstruction and Navigation	Mar 2, 2021	3D Scene ReconstructionComputational Efficiency	CodeCode Available	1
Sequential Place Learning: Heuristic-Free High-Performance Long-Term Place Recognition	Mar 2, 2021	Autonomous DrivingAutonomous Navigation	CodeCode Available	1
Hierarchical and Partially Observable Goal-driven Policy Learning with Goals Relational Graph	Mar 1, 2021	Hierarchical Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
End-to-End Egospheric Spatial Memory	Feb 15, 2021	General Reinforcement LearningImitation Learning	CodeCode Available	1
Visual Graph Memory With Unsupervised Representation for Visual Navigation	Jan 1, 2021	NavigateVisual Navigation	CodeCode Available	1
A Recurrent Vision-and-Language BERT for Navigation	Nov 26, 2020	Decision MakingDecoder	CodeCode Available	1
DeepSeqSLAM: A Trainable CNN+RNN for Joint Global Description and Sequence-based Place Recognition	Nov 17, 2020	Autonomous DrivingAutonomous Navigation	CodeCode Available	1
Visual Navigation in Real-World Indoor Environments Using End-to-End Deep Reinforcement Learning	Oct 21, 2020	Deep Reinforcement LearningGPU	CodeCode Available	1
Learning to Set Waypoints for Audio-Visual Navigation	Aug 21, 2020	Visual Navigation	CodeCode Available	1
Decoupling Exploration and Exploitation for Meta-Reinforcement Learning without Sacrifices	Aug 6, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Object Relation Graph and Tentative Policy for Visual Navigation	Jul 21, 2020	Imitation LearningRelation	CodeCode Available	1
Semantic Visual Navigation by Watching YouTube Videos	Jun 17, 2020	Q-LearningVisual Navigation	CodeCode Available	1
One-Shot Informed Robotic Visual Search in the Wild	Mar 22, 2020	NavigateRepresentation Learning	CodeCode Available	1
Visual Navigation Among Humans with Optimal Control as a Supervisor	Mar 20, 2020	NavigateRobot Navigation	CodeCode Available	1
Learning hierarchical relationships for object-goal navigation	Mar 15, 2020	ObjectReinforcement Learning	CodeCode Available	1
Sparse Graphical Memory for Robust Planning	Mar 13, 2020	Imitation LearningVisual Navigation	CodeCode Available	1
Extending Maps with Semantic and Contextual Object Information for Robot Navigation: a Learning-Based Framework using Visual and Depth Cues	Mar 13, 2020	ObjectRobot Navigation	CodeCode Available	1
MVP: Unified Motion and Visual Self-Supervised Learning for Large-Scale Robotic Navigation	Mar 2, 2020	Autonomous DrivingAutonomous Navigation	CodeCode Available	1
Towards Learning a Generic Agent for Vision-and-Language Navigation via Pre-training	Feb 25, 2020	NavigateSelf-Supervised Learning	CodeCode Available	1
Discriminative Particle Filter Reinforcement Learning for Complex Partial Observations	Feb 23, 2020	Atari GamesDecision Making	CodeCode Available	1
Think Locally, Act Globally: Federated Learning with Local and Global Representations	Jan 6, 2020	Federated LearningRepresentation Learning	CodeCode Available	1
Side-Tuning: A Baseline for Network Adaptation via Additive Side Networks	Dec 31, 2019	Imitation LearningIncremental Learning	CodeCode Available	1
SoundSpaces: Audio-Visual Navigation in 3D Environments	Dec 24, 2019	Deep Reinforcement LearningNavigate	CodeCode Available	1
Sim2Real Predictivity: Does Evaluation in Simulation Predict Real-World Performance?	Dec 13, 2019	PointGoal NavigationVisual Navigation	CodeCode Available	1
CityLearn: Diverse Real-World Environments for Sample-Efficient Navigation Policy Learning	Oct 10, 2019	Autonomous DrivingDecision Making	CodeCode Available	1
VUSFA:Variational Universal Successor Features Approximator to Improve Transfer DRL for Target Driven Visual Navigation	Aug 18, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Vision-and-Dialog Navigation	Jul 10, 2019	2kVisual Navigation	CodeCode Available	1
An Open Source and Open Hardware Deep Learning-powered Visual Navigation Engine for Autonomous Nano-UAVs	May 10, 2019	Autonomous NavigationVisual Navigation	CodeCode Available	1
Learning Exploration Policies for Navigation	Mar 5, 2019	Efficient ExplorationGeneral Reinforcement Learning	CodeCode Available	1
Self-Monitoring Navigation Agent via Auxiliary Progress Estimation	Jan 10, 2019	Natural Language Visual GroundingVision and Language Navigation	CodeCode Available	1
Learning to Learn How to Learn: Self-Adaptive Visual Navigation Using Meta-Learning	Dec 3, 2018	Meta-LearningMeta Reinforcement Learning	CodeCode Available	1
A 64mW DNN-based Visual Navigation Engine for Autonomous Nano-Drones	May 4, 2018	Autonomous NavigationVisual Navigation	CodeCode Available	1
Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments	Nov 20, 2017	Reinforcement LearningTranslation	CodeCode Available	1
Cognitive Mapping and Planning for Visual Navigation	Feb 13, 2017	Visual Navigation	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 7Next →

All datasets Cooperative Vision-and-Dialogue Navigation R2R SOON Test AI2-THOR Dmlab-30 Help, Anna! (HANNA)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NaviLLM	dist_to_end_reduction	7.9	—	Unverified
2	VLN-PETL	dist_to_end_reduction	6.13	—	Unverified
3	early to bed	dist_to_end_reduction	6.03	—	Unverified
4	HAMT	dist_to_end_reduction	5.58	—	Unverified
5	s-agent (NDH-Full)	dist_to_end_reduction	5.27	—	Unverified
6	BabyWalk (r2r-pretrain)	dist_to_end_reduction	4.46	—	Unverified
7	Environment-agnostic Multitask Learning	dist_to_end_reduction	3.91	—	Unverified
8	BabyWalk	dist_to_end_reduction	3.65	—	Unverified
9	Test2-NDH	dist_to_end_reduction	3.44	—	Unverified
10	SCoA	dist_to_end_reduction	3.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SUSA	spl	0.64	—	Unverified
2	Meta-Explore	spl	0.61	—	Unverified
3	NaviLLM	spl	0.6	—	Unverified
4	BEV-BERT	spl	0.6	—	Unverified
5	HOP	spl	0.59	—	Unverified
6	DUET	spl	0.58	—	Unverified
7	VLN-PETL	spl	0.58	—	Unverified
8	VLN-BERT	spl	0.57	—	Unverified
9	Prevalent	spl	0.51	—	Unverified
10	RCM+SIL(no early exploration)	spl	0.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AutoVLN	Nav-SPL	27.83	—	Unverified
2	NaviLLM	Nav-SPL	26.26	—	Unverified
3	Meta-Explore	Nav-SPL	25.8	—	Unverified
4	SUSA	Nav-SPL	25.47	—	Unverified
5	DUET	Nav-SPL	21.42	—	Unverified
6	GBE	Nav-SPL	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVV-IN	SPL (All)	17.27	—	Unverified
2	SAVN	SPL (All)	16.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PopArt-IMPALA	Medium Human-Normalized Score	72.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Prevalent	spl	28.72	—	Unverified