Multimodal Machine Translation

Multimodal machine translation is the task of doing machine translation with multiple data sources - for example, translating "a bird is flying over water" + an image of a bird over water to German text.

( Image credit: Findings of the Third Shared Task on Multimodal Machine Translation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 108 papers

Title	Date	Tasks	Status
Supervised Visual Attention for Simultaneous Multimodal Machine Translation	Jan 23, 2022	Machine TranslationMultimodal Machine Translation	—Unverified
The AFRL-Ohio State WMT18 Multimodal System: Combining Visual with Traditional	Oct 1, 2018	Machine TranslationMultimodal Machine Translation	—Unverified
The AFRL-OSU WMT17 Multimodal Translation System: An Image Processing Approach	Sep 1, 2017	Image CaptioningMachine Translation	—Unverified
The Case for Evaluating Multimodal Translation Models on Text Datasets	Mar 5, 2024	DescriptiveImage Captioning	—Unverified
The MeMAD Submission to the WMT18 Multimodal Translation Task	Aug 31, 2018	Machine TranslationMultimodal Machine Translation	—Unverified
TMU Japanese-English Multimodal Machine Translation System for WAT 2020	Dec 1, 2020	Data AugmentationDecoder	—Unverified
Understanding the Effect of Textual Adversaries in Multimodal Machine Translation	Nov 1, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Transformer-based Cascaded Multimodal Speech Translation	Oct 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multilingual Multimodal Machine Translation for Dravidian Languages utilizing Phonetic Transcription	Aug 1, 2019	Machine TranslationMultimodal Machine Translation	—Unverified
Multimodal Machine Translation through Visuals and Speech	Nov 28, 2019	Image CaptioningMachine Translation	—Unverified
Multimodal Machine Translation with Reinforcement Learning	May 7, 2018	Image DescriptionMachine Translation	—Unverified
Multimodal Machine Translation with Visual Scene Graph Pruning	May 26, 2025	Machine TranslationMultimodal Machine Translation	—Unverified
Multimodal Neural Machine Translation System for English to Bengali	Sep 1, 2021	Machine TranslationMultimodal Machine Translation	—Unverified
MultiNews: A Web collection of an Aligned Multimodal and Multilingual Corpus	Nov 1, 2017	ArticlesContent-Based Image Retrieval	—Unverified
NICT-NAIST System for WMT17 Multimodal Translation Task	Sep 1, 2017	Image RetrievalMachine Translation	—Unverified
Multi30K: Multilingual English-German Image Descriptions	May 2, 2016	Image DescriptionMachine Translation	CodeCode Available
Video-Helpful Multimodal Machine Translation	Oct 31, 2023	Machine TranslationMultimodal Machine Translation	CodeCode Available
Multimodal Lexical Translation	May 1, 2018	Machine TranslationMultimodal Lexical Translation	CodeCode Available
A Visual Attention Grounding Neural Model for Multimodal Machine Translation	Aug 24, 2018	Machine TranslationMultimodal Machine Translation	CodeCode Available
Findings of the Third Shared Task on Multimodal Machine Translation	Oct 1, 2018	Machine TranslationMultimodal Machine Translation	CodeCode Available
Multimodal Machine Translation with Embedding Prediction	Apr 1, 2019	Machine TranslationMultimodal Machine Translation	CodeCode Available
Distilling Translations with Visual Awareness	Jun 18, 2019	DecoderMachine Translation	CodeCode Available
Cultural and Geographical Influences on Image Translatability of Words across Languages	Jun 1, 2021	Cultural Vocal Bursts Intensity PredictionLow Resource Neural Machine Translation	CodeCode Available
Latent Variable Model for Multi-modal Translation	Nov 1, 2018	DecoderMachine Translation	CodeCode Available
Vision Matters When It Should: Sanity Checking Multimodal Machine Translation Models	Sep 8, 2021	Image CaptioningMachine Translation	CodeCode Available

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets Multi30K Hindi Visual Genome (Challenge Set)Hindi Visual Genome (Test Set)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	del	Meteor (EN-FR)	74.6	—	Unverified
2	ERNIE-UniX2	BLEU (EN-DE)	49.3	—	Unverified
3	IKD-MMT	BLEU (EN-DE)	41.28	—	Unverified
4	DCCN	BLEU (EN-DE)	39.7	—	Unverified
5	Caglayan	BLEU (EN-DE)	39.4	—	Unverified
6	Gumbel-Attention MMT	BLEU (EN-DE)	39.2	—	Unverified
7	Multimodal Transformer	BLEU (EN-DE)	38.7	—	Unverified
8	ImagiT	BLEU (EN-DE)	38.4	—	Unverified
9	del+obj	BLEU (EN-DE)	38	—	Unverified
10	VMMTF	BLEU (EN-DE)	37.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViTA	BLEU (EN-HI)	51.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViTA	BLEU (EN-HI)	44.6	—	Unverified