Vision and Language Navigation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 223 papers

Title	Date	Tasks	Status
IVLMap: Instance-Aware Visual Language Grounding for Consumer Robot Navigation	Mar 28, 2024	AttributeLanguage Modelling	—Unverified
Scaling Vision-and-Language Navigation With Offline RL	Mar 27, 2024	Offline RLVision and Language Navigation	—Unverified
OVER-NAV: Elevating Iterative Vision-and-Language Navigation with Open-Vocabulary Detection and StructurEd Representation	Mar 26, 2024	Vision and Language Navigation	—Unverified
Temporal-Spatial Object Relations Modeling for Vision-and-Language Navigation	Mar 23, 2024	NavigateObject	—Unverified
Continual Vision-and-Language Navigation	Mar 22, 2024	Continual LearningNavigate	—Unverified
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation	Mar 18, 2024	Common Sense ReasoningEfficient Exploration	CodeCode Available
Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation	Mar 15, 2024	NavigateVision and Language Navigation	—Unverified
Towards Deviation-Robust Agent Navigation via Perturbation-Aware Contrastive Learning	Mar 9, 2024	Contrastive LearningNavigate	—Unverified
Causality-based Cross-Modal Representation Learning for Vision-and-Language Navigation	Mar 6, 2024	Representation LearningVision and Language Navigation	—Unverified
NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation	Feb 24, 2024	Decision MakingInstruction Following	—Unverified
VLN-Video: Utilizing Driving Videos for Outdoor Vision-and-Language Navigation	Feb 5, 2024	Language ModelingLanguage Modelling	—Unverified
NavHint: Vision and Language Navigation Agent with a Hint Generator	Feb 4, 2024	Vision and Language Navigation	CodeCode Available
MapGPT: Map-Guided Prompting with Adaptive Path Planning for Vision-and-Language Navigation	Jan 14, 2024	Decision MakingVision and Language Navigation	—Unverified
Which way is `right'?: Uncovering limitations of Vision-and-Language Navigation model	Nov 30, 2023	Vision and Language Navigation	—Unverified
DAP: Domain-aware Prompt Learning for Vision-and-Language Navigation	Nov 29, 2023	cross-modal alignmentNavigate	—Unverified
Does VLN Pretraining Work with Nonsensical or Irrelevant Instructions?	Nov 28, 2023	Data AugmentationTranslation	—Unverified
Vision and Language Navigation in the Real World via Online Visual Language Mapping	Oct 16, 2023	Vision and Language Navigation	—Unverified
LangNav: Language as a Perceptual Representation for Navigation	Oct 11, 2023	Image CaptioningLanguage Modeling	—Unverified
Evaluating Explanation Methods for Vision-and-Language Navigation	Oct 10, 2023	Decision MakingNavigate	—Unverified
Prompt-based Context- and Domain-aware Pretraining for Vision and Language Navigation	Sep 7, 2023	Contrastive Learningcross-modal alignment	—Unverified
VLN-PETL: Parameter-Efficient Transfer Learning for Vision-and-Language Navigation	Aug 20, 2023	Transfer LearningVision and Language Navigation	CodeCode Available
A^2Nav: Action-Aware Zero-Shot Robot Navigation by Exploiting Vision-and-Language Ability of Foundation Models	Aug 15, 2023	NavigateRobot Navigation	—Unverified
Mind the Gap: Improving Success Rate of Vision-and-Language Navigation by Revisiting Oracle Success Routes	Aug 7, 2023	NavigateVision and Language Navigation	—Unverified
Kefa: A Knowledge Enhanced and Fine-grained Aligned Speaker for Navigation Instruction Generation	Jul 25, 2023	Vision and Language Navigation	CodeCode Available
Behavioral Analysis of Vision-and-Language Navigation Agents	Jul 20, 2023	Vision and Language Navigation	CodeCode Available

Show:10 25 50

← PrevPage 6 of 9Next →

All datasets VLN Challenge Touchdown Dataset RxR map2seq Room2Room robo-vln

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	human	success	0.86	—	Unverified
2	Lily	success	0.79	—	Unverified
3	Airbert	success	0.78	—	Unverified
4	explore@40 beam-search	success	0.74	—	Unverified
5	Global Normalization	success	0.74	—	Unverified
6	VLN-Bert	success	0.73	—	Unverified
7	BEVBert	success	0.73	—	Unverified
8	GMap	success	0.73	—	Unverified
9	Gloabl Normalization pre-explore	success	0.73	—	Unverified
10	FOAM-Beam Search	success	0.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FLAME	Task Completion (TC)	40.2	—	Unverified
2	ORAR + junction type + heading delta	Task Completion (TC)	29.1	—	Unverified
3	ORAR	Task Completion (TC)	24.2	—	Unverified
4	ARC + L2STOP	Task Completion (TC)	16.68	—	Unverified
5	VLN Transformer +M-50 +style	Task Completion (TC)	16.2	—	Unverified
6	VLN Transformer	Task Completion (TC)	14.9	—	Unverified
7	ARC	Task Completion (TC)	14.13	—	Unverified
8	Retouch-RConcat	Task Completion (TC)	12.8	—	Unverified
9	Gated Attention (GA)	Task Completion (TC)	11.9	—	Unverified
10	RConcat	Task Completion (TC)	11.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MARVAL	ndtw	66.76	—	Unverified
2	EnvEdit-PT	ndtw	64.61	—	Unverified
3	HAMT	ndtw	59.94	—	Unverified
4	CLEAR-CLIP	ndtw	53.69	—	Unverified
5	Monolingual Baseline	ndtw	41.05	—	Unverified
6	Multilingual Baseline	ndtw	36.81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FLAME	Task Completion (TC)	52.44	—	Unverified
2	ORAR + junction type + heading delta	Task Completion (TC)	46.7	—	Unverified
3	ORAR	Task Completion (TC)	45.1	—	Unverified
4	Gated Attention	Task Completion (TC)	17	—	Unverified
5	Rconcat	Task Completion (TC)	14.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	R2R+EnvDrop	spl	0.61	—	Unverified
2	RCM + SIL	spl	0.59	—	Unverified
3	Tactical Rewind - short	spl	0.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hierarchical Cross-Modal Agent	SPL (Sucess Weighted by Path Length)	0.4	—	Unverified