Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 10752 papers

Title	Date	Tasks	Status	Hype
GIO: Gradient Information Optimization for Training Dataset Selection	Jun 20, 2023	Machine TranslationSpelling Correction	CodeCode Available	1
Glancing Transformer for Non-Autoregressive Neural Machine Translation	Aug 18, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Go From the General to the Particular: Multi-Domain Translation with Domain Transformation Networks	Nov 22, 2019	DecoderGeneral Knowledge	CodeCode Available	1
A Simple but Tough-to-Beat Data Augmentation Approach for Natural Language Understanding and Generation	Sep 29, 2020	Data AugmentationMachine Translation	CodeCode Available	1
Graph-to-Sequence Learning using Gated Graph Neural Networks	Jun 26, 2018	Graph-to-SequenceMachine Translation	CodeCode Available	1
Graph-to-Tree Neural Networks for Learning Structured Input-Output Translation with Applications to Semantic Parsing and Math Word Problem	Apr 7, 2020	DecoderMachine Translation	CodeCode Available	1
G-Transformer for Document-level Machine Translation	May 31, 2021	Document Level Machine TranslationInductive Bias	CodeCode Available	1
Guardians of the Machine Translation Meta-Evaluation: Sentinel Metrics Fall In!	Aug 25, 2024	FairnessMachine Translation	CodeCode Available	1
Hallucinations in Large Multilingual Translation Models	Mar 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Asynchronous Bidirectional Decoding for Neural Machine Translation	Jan 16, 2018	DecoderMachine Translation	CodeCode Available	1
HAT: Hardware-Aware Transformers for Efficient Natural Language Processing	May 28, 2020	CPUDecoder	CodeCode Available	1
HausaMT v1.0: Towards English--Hausa Neural Machine Translation	Jul 1, 2020	DecoderDiversity	CodeCode Available	1
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models Aligned with Human Cognitive Principles	Jun 18, 2024	Arithmetic ReasoningCode Generation	CodeCode Available	1
How2: A Large-scale Dataset for Multimodal Language Understanding	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
How Good Are GPT Models at Machine Translation? A Comprehensive Evaluation	Feb 18, 2023	Machine TranslationText Generation	CodeCode Available	1
How Good Are LLMs for Literary Translation, Really? Literary Translation Evaluation with Humans and LLMs	Oct 24, 2024	2kMachine Translation	CodeCode Available	1
Human-Paraphrased References Improve Neural Machine Translation	Oct 20, 2020	Machine TranslationNMT	CodeCode Available	1
HyperNetworks	Sep 27, 2016	Handwriting generationLanguage Modelling	CodeCode Available	1
IESTAC: English-Italian Parallel Corpus for End-to-End Speech-to-Text Machine Translation	Nov 1, 2020	Dynamic Time WarpingMachine Translation	CodeCode Available	1
If beam search is the answer, what was the question?	Oct 6, 2020	Machine TranslationText Generation	CodeCode Available	1
3AM: An Ambiguity-Aware Multi-Modal Machine Translation Dataset	Apr 29, 2024	Machine TranslationMultimodal Machine Translation	CodeCode Available	1
An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling	Mar 4, 2018	Audio SynthesisLanguage Modelling	CodeCode Available	1
All Word Embeddings from One Embedding	Apr 25, 2020	AllDecoder	CodeCode Available	1
Improving Machine Translation with Human Feedback: An Exploration of Quality Estimation as a Reward Model	Jan 23, 2024	Machine TranslationTranslation	CodeCode Available	1
Advanced Language Model-based Translator for English-Vietnamese Translation	May 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Improving Neural Machine Translation Models with Monolingual Data	Nov 20, 2015	Cross-Lingual Bitext MiningDecoder	CodeCode Available	1
Improving the Lexical Ability of Pretrained Language Models for Unsupervised Neural Machine Translation	Mar 18, 2021	Bilingual Lexicon InductionLanguage Modeling	CodeCode Available	1
Improving Transformer Optimization Through Better Initialization	Jan 1, 2020	DecoderLanguage Modeling	CodeCode Available	1
Improving Word Translation via Two-Stage Contrastive Learning	Mar 15, 2022	Bilingual Lexicon InductionContrastive Learning	CodeCode Available	1
Improving Zero-shot Multilingual Neural Machine Translation by Leveraging Cross-lingual Consistency Regularization	May 12, 2023	Machine TranslationNMT	CodeCode Available	1
Incorporating BERT into Parallel Sequence Decoding with Adapters	Oct 13, 2020	Machine TranslationNatural Language Understanding	CodeCode Available	1
Incorporating Terminology Constraints in Automatic Post-Editing	Oct 19, 2020	Automatic Post-EditingData Augmentation	CodeCode Available	1
Adaptively Sparse Transformers	Aug 30, 2019	DiversityMachine Translation	CodeCode Available	1
Arch-Net: Model Distillation for Architecture Agnostic Model Deployment	Nov 1, 2021	image-classificationImage Classification	CodeCode Available	1
IndicXNLI: Evaluating Multilingual Inference for Indian Languages	Apr 19, 2022	Cross-Lingual TransferMachine Translation	CodeCode Available	1
IndoNLG: Benchmark and Resources for Evaluating Indonesian Natural Language Generation	Apr 16, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
A Parallel Evaluation Data Set of Software Documentation with Document Structure Annotation	Aug 11, 2020	Machine TranslationTranslation	CodeCode Available	1
INK: Injecting kNN Knowledge in Nearest Neighbor Machine Translation	Jun 10, 2023	Machine TranslationTranslation	CodeCode Available	1
Fine-Grained and Multi-Dimensional Metrics for Document-Level Machine Translation	Oct 28, 2024	Document Level Machine TranslationMachine Translation	CodeCode Available	1
Integrating Vectorized Lexical Constraints for Neural Machine Translation	Mar 23, 2022	Machine TranslationNMT	CodeCode Available	1
A parallel corpus of Python functions and documentation strings for automated code documentation and code generation	Jul 7, 2017	Code GenerationData Augmentation	CodeCode Available	1
IOT: Instance-wise Layer Reordering for Transformer Structures	Mar 5, 2021	Abstractive Text SummarizationCode Generation	CodeCode Available	1
Is normalization indispensable for training deep neural network?	Dec 1, 2020	General Classificationimage-classification	CodeCode Available	1
Iterative Refinement in the Continuous Space for Non-Autoregressive Neural Machine Translation	Sep 15, 2020	de-enMachine Translation	CodeCode Available	1
An Empirical Study of Tokenization Strategies for Various Korean NLP Tasks	Oct 6, 2020	Machine TranslationNatural Language Understanding	CodeCode Available	1
JASS: Japanese-specific Sequence to Sequence Pre-training for Neural Machine Translation	May 7, 2020	Low Resource NMTMachine Translation	CodeCode Available	1
Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models	May 22, 2023	Machine Translation	CodeCode Available	1
KazParC: Kazakh Parallel Corpus for Machine Translation	Mar 28, 2024	Machine TranslationTranslation	CodeCode Available	1
A Probabilistic Formulation of Unsupervised Text Style Transfer	Feb 10, 2020	DeciphermentLanguage Modelling	CodeCode Available	1
AR-Diffusion: Auto-Regressive Diffusion Model for Text Generation	May 16, 2023	Common Sense ReasoningDenoising	CodeCode Available	1

Show:10 25 50

← PrevPage 14 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified