Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 10752 papers

Title	Date	Tasks	Status	Hype
With Little Power Comes Great Responsibility	Oct 13, 2020	Experimental DesignMachine Translation	CodeCode Available	1
The Tatoeba Translation Challenge -- Realistic Data Sets for Low Resource and Multilingual MT	Oct 13, 2020	Few-Shot LearningMachine Translation	CodeCode Available	1
Gender Coreference and Bias Evaluation at WMT 2020	Oct 12, 2020	Machine TranslationTranslation	CodeCode Available	1
Gradient Vaccine: Investigating and Improving Multi-task Optimization in Massively Multilingual Models	Oct 12, 2020	Machine TranslationMulti-Task Learning	CodeCode Available	1
On Long-Tailed Phenomena in Neural Machine Translation	Oct 10, 2020	Conditional Text GenerationMachine Translation	CodeCode Available	1
Token-level Adaptive Training for Neural Machine Translation	Oct 9, 2020	DiversityMachine Translation	CodeCode Available	1
ChrEn: Cherokee-English Machine Translation for Endangered Language Revitalization	Oct 9, 2020	Cultural Vocal Bursts Intensity PredictionLanguage Modelling	CodeCode Available	1
MLQE-PE: A Multilingual Quality Estimation and Post-Editing Dataset	Oct 9, 2020	ArticlesAutomatic Post-Editing	CodeCode Available	1
Shallow-to-Deep Training for Neural Machine Translation	Oct 8, 2020	Machine TranslationNMT	CodeCode Available	1
WikiLingua: A New Benchmark Dataset for Cross-Lingual Abstractive Summarization	Oct 7, 2020	Abstractive Text SummarizationCross-Lingual Abstractive Summarization	CodeCode Available	1
Pre-training Multilingual Neural Machine Translation by Leveraging Alignment Information	Oct 7, 2020	Machine TranslationTranslation	CodeCode Available	1
If beam search is the answer, what was the question?	Oct 6, 2020	Machine TranslationText Generation	CodeCode Available	1
Data Rejuvenation: Exploiting Inactive Training Examples for Neural Machine Translation	Oct 6, 2020	Machine TranslationNMT	CodeCode Available	1
An Empirical Study of Tokenization Strategies for Various Korean NLP Tasks	Oct 6, 2020	Machine TranslationNatural Language Understanding	CodeCode Available	1
Improving AMR Parsing with Sequence-to-Sequence Pre-training	Oct 5, 2020	Abstract Meaning RepresentationAMR Parsing	CodeCode Available	1
X-SRL: A Parallel Cross-Lingual Semantic Role Labeling Dataset	Oct 5, 2020	Machine TranslationSemantic Role Labeling	CodeCode Available	1
Participatory Research for Low-resourced Machine Translation: A Case Study in African Languages	Oct 5, 2020	DiversityMachine Translation	CodeCode Available	1
A Streaming Approach For Efficient Batched Beam Search	Oct 5, 2020	GPUMachine Translation	CodeCode Available	1
Leveraging Multilingual News Websites for Building a Kurdish Parallel Corpus	Oct 4, 2020	ArticlesMachine Translation	CodeCode Available	1
Nearest Neighbor Machine Translation	Oct 1, 2020	DecoderMachine Translation	CodeCode Available	1
Can Automatic Post-Editing Improve NMT?	Sep 30, 2020	Automatic Post-EditingMachine Translation	CodeCode Available	1
A Simple but Tough-to-Beat Data Augmentation Approach for Natural Language Understanding and Generation	Sep 29, 2020	Data AugmentationMachine Translation	CodeCode Available	1
Representation Learning from Limited Educational Data with Crowdsourced Labels	Sep 23, 2020	Face RecognitionMachine Translation	CodeCode Available	1
Consecutive Decoding for Speech-to-text Translation	Sep 21, 2020	DecoderMachine Translation	CodeCode Available	1
Not Low-Resource Anymore: Aligner Ensembling, Batch Filtering, and New Datasets for Bengali-English Machine Translation	Sep 20, 2020	Machine TranslationSentence	CodeCode Available	1
Towards Computational Linguistics in Minangkabau Language: Studies on Sentiment Analysis and Machine Translation	Sep 19, 2020	Machine TranslationSentiment Analysis	CodeCode Available	1
Reusing a Pretrained Language Model on Languages with Limited Corpora for Unsupervised NMT	Sep 16, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Text Generation by Learning from Demonstrations	Sep 16, 2020	Machine TranslationQuestion Generation	CodeCode Available	1
Iterative Refinement in the Continuous Space for Non-Autoregressive Neural Machine Translation	Sep 15, 2020	de-enMachine Translation	CodeCode Available	1
Simultaneous Machine Translation with Visual Context	Sep 15, 2020	Machine TranslationTranslation	CodeCode Available	1
Why Not Simply Translate? A First Swedish Evaluation Benchmark for Semantic Similarity	Sep 7, 2020	Machine TranslationSemantic Similarity	CodeCode Available	1
Dynamic Context-guided Capsule Network for Multimodal Machine Translation	Sep 4, 2020	DecoderMachine Translation	CodeCode Available	1
Bidirectional Attention Network for Monocular Depth Estimation	Sep 1, 2020	Depth EstimationMachine Translation	CodeCode Available	1
Neural Machine Translation without Embeddings	Aug 21, 2020	DecoderMachine Translation	CodeCode Available	1
Lite Training Strategies for Portuguese-English and English-Portuguese Translation	Aug 20, 2020	GPUMachine Translation	CodeCode Available	1
Glancing Transformer for Non-Autoregressive Neural Machine Translation	Aug 18, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Very Deep Transformers for Neural Machine Translation	Aug 18, 2020	DecoderMachine Translation	CodeCode Available	1
Offline Meta-Reinforcement Learning with Advantage Weighting	Aug 13, 2020	Machine TranslationMeta-Learning	CodeCode Available	1
A Parallel Evaluation Data Set of Software Documentation with Document Structure Annotation	Aug 11, 2020	Machine TranslationTranslation	CodeCode Available	1
Paraphrase Generation as Zero-Shot Multilingual Translation: Disentangling Semantic Similarity from Lexical and Syntactic Diversity	Aug 11, 2020	DiversityMachine Translation	CodeCode Available	1
A Multilingual Neural Machine Translation Model for Biomedical Data	Aug 6, 2020	Machine TranslationTranslation	CodeCode Available	1
Designing the Business Conversation Corpus	Aug 5, 2020	Machine TranslationTranslation	CodeCode Available	1
DeLighT: Deep and Light-weight Transformer	Aug 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Multilingual Translation with Extensible Multilingual Pretraining and Finetuning	Aug 2, 2020	Machine TranslationTranslation	CodeCode Available	1
BSL-1K: Scaling up co-articulated sign language recognition using mouthing cues	Jul 23, 2020	Action ClassificationKeyword Spotting	CodeCode Available	1
CoVoST 2 and Massively Multilingual Speech-to-Text Translation	Jul 20, 2020	Machine Translationspeech-recognition	CodeCode Available	1
CoCoNuT: Combining Context-Aware Neural Translation Models using Ensemble for Program Repair	Jul 18, 2020	Ensemble LearningMachine Translation	CodeCode Available	1
A Novel Graph-based Multi-modal Fusion Encoder for Neural Machine Translation	Jul 17, 2020	DecoderMachine Translation	CodeCode Available	1
Sequence Generation with Mixed Representations	Jul 11, 2020	Abstractive Text SummarizationDiversity	CodeCode Available	1
AdaScale SGD: A User-Friendly Algorithm for Distributed Training	Jul 9, 2020	image-classificationImage Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 13 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified