Multimodal Machine Translation

Multimodal machine translation is the task of doing machine translation with multiple data sources - for example, translating "a bird is flying over water" + an image of a bird over water to German text.

( Image credit: Findings of the Third Shared Task on Multimodal Machine Translation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 108 papers

Title	Date	Tasks	Status
ViTA: Visual-Linguistic Translation by Aligning Object Tags	Jun 1, 2021	Machine TranslationMultimodal Machine Translation	CodeCode Available
Good for Misconceived Reasons: An Empirical Revisiting on the Need for Visual Context in Multimodal Machine Translation	May 30, 2021	Machine TranslationMultimodal Machine Translation	—Unverified
Gumbel-Attention for Multi-modal Machine Translation	Mar 16, 2021	Machine TranslationMultimodal Machine Translation	—Unverified
Good for Misconceived Reasons: Revisiting Neural Multimodal Machine Translation	Jan 1, 2021	Machine TranslationMultimodal Machine Translation	—Unverified
Efficient Object-Level Visual Context Modeling for Multimodal Machine Translation: Masking Irrelevant Objects Helps Grounding	Dec 18, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
MSVD-Turkish: A Comprehensive Multimodal Dataset for Integrated Vision and Language Research in Turkish	Dec 13, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
TMU Japanese-English Multimodal Machine Translation System for WAT 2020	Dec 1, 2020	Data AugmentationDecoder	—Unverified
Generative Imagination Elevates Machine Translation	Sep 21, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
A Visually-Grounded Parallel Corpus with Phrase-to-Region Linking	May 1, 2020	Image CaptioningMachine Translation	—Unverified
Investigating the Decoders of Maximum Likelihood Sequence Models: A Look-ahead Approach	Mar 8, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
Multimodal Machine Translation through Visuals and Speech	Nov 28, 2019	Image CaptioningMachine Translation	—Unverified
Adaptive Fusion Techniques for Multimodal Data	Nov 10, 2019	Emotion RecognitionMachine Translation	—Unverified
Understanding the Effect of Textual Adversaries in Multimodal Machine Translation	Nov 1, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Transformer-based Cascaded Multimodal Speech Translation	Oct 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On Leveraging the Visual Modality for Neural Machine Translation	Oct 7, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Probing Representations Learned by Multimodal Recurrent and Transformer Models	Aug 29, 2019	Image RetrievalLanguage Modeling	—Unverified
Multilingual Multimodal Machine Translation for Dravidian Languages utilizing Phonetic Transcription	Aug 1, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Hindi Visual Genome: A Dataset for Multimodal English-to-Hindi Machine Translation	Jul 21, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Distilling Translations with Visual Awareness	Jun 18, 2019	DecoderMachine Translation	CodeCode Available
Grounded Word Sense Translation	Jun 1, 2019	Grounded language learningMachine Translation	—Unverified
Debiasing Word Embeddings Improves Multimodal Machine Translation	May 24, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Multimodal Machine Translation with Embedding Prediction	Apr 1, 2019	Machine TranslationMultimodal Machine Translation	CodeCode Available
Probing the Need for Visual Context in Multimodal Machine Translation	Mar 20, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Latent Variable Model for Multi-modal Translation	Nov 1, 2018	DecoderMachine Translation	CodeCode Available
UMONS Submission for WMT18 Multimodal Translation Task	Oct 15, 2018	Image CaptioningMachine Translation	CodeCode Available

Show:10 25 50

← PrevPage 3 of 5Next →

All datasets Multi30K Hindi Visual Genome (Challenge Set)Hindi Visual Genome (Test Set)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	del	Meteor (EN-FR)	74.6	—	Unverified
2	ERNIE-UniX2	BLEU (EN-DE)	49.3	—	Unverified
3	IKD-MMT	BLEU (EN-DE)	41.28	—	Unverified
4	DCCN	BLEU (EN-DE)	39.7	—	Unverified
5	Caglayan	BLEU (EN-DE)	39.4	—	Unverified
6	Gumbel-Attention MMT	BLEU (EN-DE)	39.2	—	Unverified
7	Multimodal Transformer	BLEU (EN-DE)	38.7	—	Unverified
8	ImagiT	BLEU (EN-DE)	38.4	—	Unverified
9	del+obj	BLEU (EN-DE)	38	—	Unverified
10	VMMTF	BLEU (EN-DE)	37.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViTA	BLEU (EN-HI)	51.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViTA	BLEU (EN-HI)	44.6	—	Unverified