Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9100 of 10752 papers

Title	Date	Tasks	Status
Orthographic and Morphological Processing for Persian-to-English Statistical Machine Translation	Oct 1, 2013	Machine TranslationTranslation	—Unverified
Orthographic Features for Bilingual Lexicon Induction	Jul 1, 2018	Bilingual Lexicon InductionMachine Translation	—Unverified
OSN-MDAD: Machine Translation Dataset for Arabic Multi-Dialectal Conversations on Online Social Media	Sep 21, 2023	Machine TranslationNMT	—Unverified
OSU Multimodal Machine Translation System Report	Oct 7, 2017	Image CaptioningMachine Translation	—Unverified
Our Neural Machine Translation Systems for WAT 2019	Nov 1, 2019	Machine TranslationNMT	—Unverified
Out-of-Order Decoding for Robust Neural Machine Translation	Oct 23, 2018	DecoderMachine Translation	—Unverified
Out-of-the-box Universal Romanization Tool uroman	Jul 1, 2018	Machine Translation	—Unverified
Overcoming a Theoretical Limitation of Self-Attention	Nov 16, 2021	LEMMAMachine Translation	—Unverified
Overcoming Catastrophic Forgetting During Domain Adaptation of Neural Machine Translation	Jun 1, 2019	BIG-bench Machine LearningDomain Adaptation	—Unverified
Overcoming Resistance: The Normalization of an Amazonian Tribal Language	Dec 1, 2020	ArticlesMachine Translation	—Unverified
Overcoming the Curse of Sentence Length for Neural Machine Translation using Automatic Segmentation	Sep 3, 2014	Machine TranslationSentence	—Unverified
Overcoming the Rare Word Problem for Low-Resource Language Pairs in Neural Machine Translation	Oct 7, 2019	Machine TranslationNMT	—Unverified
Overcoming Vocabulary Constraints with Pixel-level Fallback	Apr 2, 2025	Computational EfficiencyCross-Lingual Transfer	—Unverified
Overestimation in LLM Evaluation: A Controlled Large-Scale Study on Data Contamination's Impact on Machine Translation	Jan 30, 2025	Machine Translation	—Unverified
Overview of the 1st Workshop on Asian Translation	Oct 1, 2014	Machine TranslationTranslation	—Unverified
Overview of the 2013 ALTA Shared Task	Dec 1, 2013	Machine TranslationMulti-Label Classification	—Unverified
Overview of the 2nd Workshop on Asian Translation	Oct 1, 2015	Machine TranslationTranslation	—Unverified
Overview of the 3rd Workshop on Asian Translation	Dec 1, 2016	Machine TranslationTranslation	—Unverified
Overview of the 4th Workshop on Asian Translation	Nov 1, 2017	Machine TranslationTranslation	—Unverified
Overview of the IWSLT 2017 Evaluation Campaign	Dec 1, 2017	Machine TranslationTranslation	—Unverified
Overview of the Second BUCC Shared Task: Spotting Parallel Sentences in Comparable Corpora	Aug 1, 2017	Machine TranslationSentence	—Unverified
Overview of the Shared Task on Machine Translation in Dravidian Languages	May 1, 2022	Machine TranslationTranslation	—Unverified
PaCCSS-IT: A Parallel Corpus of Complex-Simple Sentences for Automatic Text Simplification	Nov 1, 2016	Dependency ParsingDomain Adaptation	—Unverified
PaCMan : Parallel Corpus Management Workbench	Dec 1, 2014	ChunkingMachine Translation	—Unverified
PAD: Towards Efficient Data Generation for Transfer Learning Using Phrase Alignment	Mar 24, 2025	Machine TranslationTransfer Learning	—Unverified
Pair Language Models for Deriving Alternative Pronunciations and Spellings from Pronunciation Dictionaries	Oct 1, 2013	Machine TranslationSpelling Correction	—Unverified
PairReranker: Pairwise Reranking for Natural Language Generation	Dec 20, 2022	Machine TranslationReranking	—Unverified
Pairwise Neural Machine Translation Evaluation	Dec 5, 2019	Machine TranslationSentence	—Unverified
PangeaMT v 3 – customise your own machine translation environment	May 1, 2016	Machine TranslationTranslation	—Unverified
PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing	Mar 20, 2023	Code GenerationLanguage Modeling	—Unverified
Panlingua-KMI MT System for Similar Language Translation Task at WMT 2019	Aug 1, 2019	Machine TranslationNMT	—Unverified
papago: A Machine Translation Service with Word Sense Disambiguation and Currency Conversion	Dec 1, 2016	Machine TranslationOptical Character Recognition (OCR)	—Unverified
ParaBank: Monolingual Bitext Generation and Sentential Paraphrasing via Lexically-constrained Neural Machine Translation	Jan 11, 2019	DiversityMachine Translation	—Unverified
ParaCotta: Synthetic Multilingual Paraphrase Corpora from the Most Diverse Translation Sample Pair	May 10, 2022	Machine TranslationSentence	—Unverified
ParaDi: Dictionary of Paraphrases of Czech Complex Predicates with Light Verbs	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
PARADIGM: Paraphrase Diagnostics through Grammar Matching	Apr 1, 2014	Machine TranslationQuestion Answering	—Unverified
PARADISE”:" Exploiting Parallel Data for Multilingual Sequence-to-Sequence Pretraining	May 1, 2022	Cross-Lingual Natural Language InferenceDenoising	—Unverified
Parallel Aligned Treebanks at LDC: New Challenges Interfacing Existing Infrastructures	May 1, 2012	Machine TranslationSentence	—Unverified
Parallel Attention Forcing for Machine Translation	Nov 6, 2022	Machine TranslationNMT	—Unverified
Parallel Attention Mechanisms in Neural Machine Translation	Oct 29, 2018	DecoderMachine Translation	—Unverified
Parallel Corpora for bi-Directional Statistical Machine Translation for Seven Ethiopian Language Pairs	Aug 1, 2018	Machine TranslationTranslation	—Unverified
Parallel Corpora for bi-lingual English-Ethiopian Languages Statistical Machine Translation	Aug 1, 2018	Machine TranslationTranslation	—Unverified
Parallel Corpora in Mboshi (Bantu C25, Congo-Brazzaville)	May 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Parallel Corpus Filtering via Pre-trained Language Models	May 13, 2020	Language ModelingLanguage Modelling	—Unverified
Parallel Data, Tools and Interfaces in OPUS	May 1, 2012	Machine TranslationTranslation	—Unverified
Parallel FDA5 for Fast Deployment of Accurate Statistical Machine Translation Systems	Jun 1, 2014	Active LearningLanguage Modelling	—Unverified
Parallelizing Word2Vec in Shared and Distributed Memory	Apr 15, 2016	CPUMachine Translation	—Unverified
Parallel resources for Tunisian Arabic Dialect Translation	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified
Parallel Sentence Compression	Dec 1, 2016	ArticlesMachine Translation	—Unverified
Parallel Sentence Extraction from Comparable Corpora with Neural Network Features	May 1, 2016	Machine TranslationSentence	—Unverified

Show:10 25 50

← PrevPage 182 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified