Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10226–10250 of 10752 papers

Title	Date	Tasks	Status
How Good are LLMs at Relation Extraction under Low-Resource Scenario? Comprehensive Evaluation	Jun 17, 2024	Machine TranslationRelation	CodeCode Available
Difficulty-Aware Machine Translation Evaluation	Jul 30, 2021	Machine TranslationSentence	CodeCode Available
How Good is Zero-Shot MT Evaluation for Low Resource Indian Languages?	Jun 6, 2024	Machine Translation	CodeCode Available
How Grammatical is Character-level Neural Machine Translation? Assessing MT Quality with Contrastive Translation Pairs	Dec 14, 2016	Machine TranslationNMT	CodeCode Available
Scalable Machine Translation in Memory Constrained Environments	Oct 6, 2016	Machine TranslationTranslation	CodeCode Available
Dict2vec : Learning Word Embeddings using Lexical Dictionaries	Sep 1, 2017	General ClassificationKnowledge Graphs	CodeCode Available
Multi30K: Multilingual English-German Image Descriptions	May 2, 2016	Image DescriptionMachine Translation	CodeCode Available
Learning the Relation between Code Features and Code Transforms with Structured Prediction	Jul 22, 2019	Bug fixingMachine Translation	CodeCode Available
Power Law Graph Transformer for Machine Translation and Representation Learning	Jun 27, 2021	Machine TranslationQuantization	CodeCode Available
Cross-model Back-translated Distillation for Unsupervised Machine Translation	Jun 3, 2020	DenoisingDiversity	CodeCode Available
How Much Do LLMs Hallucinate across Languages? On Multilingual Estimation of LLM Hallucination in the Wild	Feb 18, 2025	ArticlesHallucination	CodeCode Available
On Automatic Parsing of Log Records	Feb 12, 2021	Log ParsingMachine Translation	CodeCode Available
How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation	Mar 25, 2016	Machine TranslationResponse Generation	CodeCode Available
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Onception: Active Learning with Expert Advice for Real World Machine Translation	Mar 9, 2022	Active LearningMachine Translation	CodeCode Available
How sensitive are translation systems to extra contexts? Mitigating gender bias in Neural Machine Translation models through relevant contexts	May 22, 2022	Bias DetectionMachine Translation	CodeCode Available
Multi-Agent Sampling: Scaling Inference Compute for Data Synthesis with Tree Search-Based Agentic Collaboration	Dec 22, 2024	Decision MakingMachine Translation	CodeCode Available
BiSECT: Learning to Split and Rephrase Sentences with Bitexts	Sep 10, 2021	Machine TranslationSentence	CodeCode Available
How Should Markup Tags Be Translated?	Nov 1, 2020	Data AugmentationMachine Translation	CodeCode Available
How Suitable Are Subword Segmentation Strategies for Translating Non-Concatenative Morphology?	Sep 2, 2021	Machine TranslationSegmentation	CodeCode Available
How Time Matters: Learning Time-Decay Attention for Contextual Spoken Language Understanding in Dialogues	Jun 1, 2018	Dialogue State TrackingImage Captioning	CodeCode Available
Learning to Copy for Automatic Post-Editing	Nov 9, 2019	Automatic Post-EditingMachine Translation	CodeCode Available
A Resource-Light Method for Cross-Lingual Semantic Textual Similarity	Jan 19, 2018	Cross-Lingual Information RetrievalCross-Lingual Semantic Textual Similarity	CodeCode Available
Auto-Encoding Variational Neural Machine Translation	Jul 27, 2018	Machine TranslationSentence	CodeCode Available
DiNADO: Norm-Disentangled Neurally-Decomposed Oracles for Controlling Language Models	Jun 20, 2023	Machine Translation	CodeCode Available

Show:10 25 50

← PrevPage 410 of 431Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified