Visual Navigation

Visual Navigation is the problem of navigating an agent, e.g. a mobile robot, in an environment using camera input only. The agent is given a target image (an image it will see from the target position), and its goal is to move from its current position to the target by applying a sequence of actions, based on the camera observations only.

Source: Vision-based Navigation Using Deep Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 316 papers

Title	Date	Tasks	Status	Hype
CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual Navigation in Noisy Environments	Jun 6, 2023	Hierarchical Reinforcement LearningNavigate	—Unverified	0
SACSoN: Scalable Autonomous Control for Social Navigation	Jun 2, 2023	Continual Learningcounterfactual	—Unverified	0
Sonicverse: A Multisensory Simulation Platform for Embodied Household Agents that See and Hear	Jun 1, 2023	Multi-Task LearningVisual Navigation	CodeCode Available	1
NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models	May 26, 2023	Instruction FollowingVision and Language Navigation	CodeCode Available	2
L-SA: Learning Under-Explored Targets in Multi-Target Reinforcement Learning	May 23, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0
Fast Traversability Estimation for Wild Visual Navigation	May 15, 2023	NavigateSelf-Supervised Learning	—Unverified	0
Moving Forward by Moving Backward: Embedding Action Impact over Action Semantics	Apr 24, 2023	Visual Navigation	—Unverified	0
Filter-Aware Model-Predictive Control	Apr 20, 2023	modelModel Predictive Control	—Unverified	0
Improving Vision-and-Language Navigation by Generating Future-View Image Semantics	Apr 11, 2023	Image GenerationNavigate	—Unverified	0
OVRL-V2: A simple state-of-art baseline for ImageNav and ObjectNav	Mar 14, 2023	object-detectionObject Detection	—Unverified	0
DRISHTI: Visual Navigation Assistant for Visually Impaired	Mar 13, 2023	Visual Navigation	—Unverified	0
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding	Mar 7, 2023	Vision and Language NavigationVisual Navigation	—Unverified	0
Robustness of Utilizing Feedback in Embodied Visual Navigation	Mar 6, 2023	ObjectVisual Navigation	—Unverified	0
POPGym: Benchmarking Partially Observable Reinforcement Learning	Mar 3, 2023	BenchmarkingGPU	CodeCode Available	2
Renderable Neural Radiance Map for Visual Navigation	Mar 1, 2023	DescriptiveVisual Localization	CodeCode Available	1
ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion	Feb 9, 2023	Question AnsweringVisual Navigation	—Unverified	0
Embodied Agents for Efficient Exploration and Smart Scene Description	Jan 17, 2023	Efficient ExplorationImage Captioning	—Unverified	0
Object-Goal Visual Navigation via Effective Exploration of Relations Among Historical Navigation States	Jan 1, 2023	State Estimationvalid	—Unverified	0
Knowledge-driven Scene Priors for Semantic Audio-Visual Embodied Navigation	Dec 21, 2022	Visual Navigation	—Unverified	0
Offline Reinforcement Learning for Visual Navigation	Dec 16, 2022	NavigateOffline RL	CodeCode Available	1
BEVBert: Multimodal Map Pre-training for Language-guided Navigation	Dec 8, 2022	Vision and Language NavigationVisual Navigation	CodeCode Available	2
Navigating to Objects in the Real World	Dec 2, 2022	NavigateVisual Navigation	—Unverified	0
Instance-Specific Image Goal Navigation: Training Embodied Agents to Find Object Instances	Nov 29, 2022	Visual Navigation	—Unverified	0
MoDA: Map style transfer for self-supervised Domain Adaptation of embodied agents	Nov 29, 2022	Domain AdaptationStyle Transfer	—Unverified	0
Predicting Topological Maps for Visual Navigation in Unexplored Environments	Nov 23, 2022	Visual Navigation	—Unverified	0
Last-Mile Embodied Visual Navigation	Nov 21, 2022	Visual Navigation	CodeCode Available	1
NaRPA: Navigation and Rendering Pipeline for Astronautics	Nov 3, 2022	Visual Navigation	—Unverified	0
Towards Versatile Embodied Navigation	Oct 30, 2022	Decision MakingVision-Language Navigation	CodeCode Available	1
ViNL: Visual Navigation and Locomotion Over Obstacles	Oct 26, 2022	NavigateVisual Navigation	CodeCode Available	1
Scaling up and Stabilizing Differentiable Planning with Implicit Differentiation	Oct 24, 2022	Visual Navigation	—Unverified	0
AVLEN: Audio-Visual-Language Embodied Navigation in 3D Environments	Oct 14, 2022	AI AgentHierarchical Reinforcement Learning	—Unverified	0
Retrospectives on the Embodied AI Workshop	Oct 13, 2022	Visual Navigation	—Unverified	0
Pay Self-Attention to Audio-Visual Navigation	Oct 4, 2022	Visual Navigation	—Unverified	0
Autonomous Visual Navigation A Biologically Inspired Approach	Sep 19, 2022	Visual Navigation	—Unverified	0
Towards self-attention based visual navigation in the real world	Sep 15, 2022	Deep Reinforcement LearningSelf-Driving Cars	—Unverified	0
UAS Navigation in the Real World Using Visual Observation	Aug 25, 2022	Landmark RecognitionReinforcement Learning (RL)	—Unverified	0
Learning from Unlabeled 3D Environments for Vision-and-Language Navigation	Aug 24, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
MemoNav: Selecting Informative Memories for Visual Navigation	Aug 20, 2022	Action GenerationGraph Attention	—Unverified	0
See What the Robot Can't See: Learning Cooperative Perception for Visual Navigation	Aug 1, 2022	Graph Neural NetworkImitation Learning	CodeCode Available	0
RCA: Ride Comfort-Aware Visual Navigation via Self-Supervised Learning	Jul 29, 2022	Self-Supervised LearningVisual Navigation	—Unverified	0
Visual Pre-training for Navigation: What Can We Learn from Noise?	Jun 30, 2022	Inductive BiasNavigate	CodeCode Available	0
Good Time to Ask: A Learning Framework for Asking for Help in Embodied Visual Navigation	Jun 20, 2022	Visual Navigation	CodeCode Available	0
What do navigation agents learn about their environment?	Jun 17, 2022	Visual Navigation	CodeCode Available	1
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning	Jun 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Zero-shot object goal visual navigation	Jun 15, 2022	Knowledge GraphsObject	CodeCode Available	1
Integrating Symmetry into Differentiable Planning with Steerable Convolutions	Jun 8, 2022	Decision MakingVisual Navigation	—Unverified	0
SAMPLE-HD: Simultaneous Action and Motion Planning Learning Environment	Jun 1, 2022	Motion PlanningQuestion Answering	—Unverified	0
Towards Generalisable Audio Representations for Audio-Visual Navigation	Jun 1, 2022	Contrastive LearningData Augmentation	—Unverified	0
Image Augmentation Based Momentum Memory Intrinsic Reward for Sparse Reward Visual Scenes	May 19, 2022	Image AugmentationRepresentation Learning	—Unverified	0
GraphMapper: Efficient Visual Navigation by Scene Graph Generation	May 17, 2022	Graph GenerationNavigate	—Unverified	0

Show:10 25 50

← PrevPage 3 of 7Next →

All datasets Cooperative Vision-and-Dialogue Navigation R2R SOON Test AI2-THOR Dmlab-30 Help, Anna! (HANNA)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	NaviLLM	dist_to_end_reduction	7.9	—	Unverified
2	VLN-PETL	dist_to_end_reduction	6.13	—	Unverified
3	early to bed	dist_to_end_reduction	6.03	—	Unverified
4	HAMT	dist_to_end_reduction	5.58	—	Unverified
5	s-agent (NDH-Full)	dist_to_end_reduction	5.27	—	Unverified
6	BabyWalk (r2r-pretrain)	dist_to_end_reduction	4.46	—	Unverified
7	Environment-agnostic Multitask Learning	dist_to_end_reduction	3.91	—	Unverified
8	BabyWalk	dist_to_end_reduction	3.65	—	Unverified
9	Test2-NDH	dist_to_end_reduction	3.44	—	Unverified
10	SCoA	dist_to_end_reduction	3.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SUSA	spl	0.64	—	Unverified
2	Meta-Explore	spl	0.61	—	Unverified
3	NaviLLM	spl	0.6	—	Unverified
4	BEV-BERT	spl	0.6	—	Unverified
5	HOP	spl	0.59	—	Unverified
6	DUET	spl	0.58	—	Unverified
7	VLN-PETL	spl	0.58	—	Unverified
8	VLN-BERT	spl	0.57	—	Unverified
9	Prevalent	spl	0.51	—	Unverified
10	RCM+SIL(no early exploration)	spl	0.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AutoVLN	Nav-SPL	27.83	—	Unverified
2	NaviLLM	Nav-SPL	26.26	—	Unverified
3	Meta-Explore	Nav-SPL	25.8	—	Unverified
4	SUSA	Nav-SPL	25.47	—	Unverified
5	DUET	Nav-SPL	21.42	—	Unverified
6	GBE	Nav-SPL	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVV-IN	SPL (All)	17.27	—	Unverified
2	SAVN	SPL (All)	16.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PopArt-IMPALA	Medium Human-Normalized Score	72.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Prevalent	spl	28.72	—	Unverified