Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 10752 papers

Title	Date	Tasks	Status	Hype
Large Language Models as Span Annotators	Apr 11, 2025	Data-to-Text GenerationMachine Translation	—Unverified	0
DeepSeek vs. o3-mini: How Well can Reasoning LLMs Evaluate MT and Summarization?	Apr 10, 2025	Machine Translationnlg evaluation	—Unverified	0
Do LLMs Understand Your Translations? Evaluating Paragraph-level MT with Question Answering	Apr 10, 2025	Machine TranslationQuestion Answering	CodeCode Available	0
Redefining Machine Translation on Social Network Services with Large Language Models	Apr 10, 2025	Machine TranslationTranslation	CodeCode Available	0
Context-Aware Monolingual Human Evaluation of Machine Translation	Apr 10, 2025	Machine TranslationTranslation	—Unverified	0
Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Scalable Automated Assessment with LLM-as-a-Judge	Apr 10, 2025	Adversarial RobustnessBenchmarking	CodeCode Available	0
DoCIA: An Online Document-Level Context Incorporation Agent for Speech Translation	Apr 7, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
M-Prometheus: A Suite of Open Multilingual LLM Judges	Apr 7, 2025	Machine TranslationModel Selection	CodeCode Available	5
MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation	Apr 4, 2025	Machine TranslationTranslation	CodeCode Available	2
Extending CREAMT: Leveraging Large Language Models for Literary Translation Post-Editing	Apr 3, 2025	Machine TranslationTranslation	—Unverified	0
Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole	Apr 3, 2025	Machine TranslationTranslation	—Unverified	0
ContrastScore: Towards Higher Quality, Less Biased, More Efficient Evaluation Metrics with Contrastive Evaluation	Apr 2, 2025	Machine TranslationText Generation	—Unverified	0
Overcoming Vocabulary Constraints with Pixel-level Fallback	Apr 2, 2025	Computational EfficiencyCross-Lingual Transfer	—Unverified	0
Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation	Apr 2, 2025	Cross-Lingual TransferDecoder	—Unverified	0
Is LLM the Silver Bullet to Low-Resource Languages Machine Translation?	Mar 31, 2025	ArticlesKnowledge Distillation	—Unverified	0
You Cannot Feed Two Birds with One Score: the Accuracy-Naturalness Tradeoff in Translation	Mar 31, 2025	Machine TranslationTranslation	—Unverified	0
The Impact of Code-switched Synthetic Data Quality is Task Dependent: Insights from MT and ASR	Mar 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Using Source-Side Confidence Estimation for Reliable Translation into Unfamiliar Languages	Mar 30, 2025	Machine TranslationTranslation	CodeCode Available	0
Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation	Mar 28, 2025	Low Resource NMTMachine Translation	—Unverified	0
Non-Monotonic Attention-based Read/Write Policy Learning for Simultaneous Translation	Mar 28, 2025	Binary ClassificationMachine Translation	—Unverified	0
Training in translation tools and technologies: Findings of the EMT survey 2023	Mar 26, 2025	Machine TranslationSurvey	—Unverified	0
Sociotechnical Effects of Machine Translation	Mar 26, 2025	Machine TranslationTranslation	—Unverified	0
HausaNLP at SemEval-2025 Task 2: Entity-Aware Fine-tuning vs. Prompt Engineering in Entity-Aware Machine Translation	Mar 25, 2025	Machine TranslationPrompt Engineering	—Unverified	0
Low-resource Machine Translation for Code-switched Kazakh-Russian Language Pair	Mar 25, 2025	Machine TranslationTranslation	—Unverified	0
Sun-Shine: A Large Language Model for Tibetan Culture	Mar 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
PAD: Towards Efficient Data Generation for Transfer Learning Using Phrase Alignment	Mar 24, 2025	Machine TranslationTransfer Learning	—Unverified	0
Natural Language Generation	Mar 20, 2025	Image CaptioningImage to text	—Unverified	0
Distributed LLMs and Multimodal Large Language Models: A Survey on Advances, Challenges, and Future Directions	Mar 20, 2025	2D Object DetectionDistributed Computing	CodeCode Available	1
Automatically Generating Chinese Homophone Words to Probe Machine Translation Estimation Systems	Mar 20, 2025	Machine TranslationMulti-Task Learning	CodeCode Available	0
Self-Vocabularizing Training for Neural Machine Translation	Mar 18, 2025	Machine TranslationTranslation	—Unverified	0
New Trends for Modern Machine Translation with Large Reasoning Models	Mar 13, 2025	Machine TranslationTranslation	—Unverified	0
Source-primed Multi-turn Conversation Helps Large Language Models Translate Documents	Mar 13, 2025	Document Level Machine TranslationMachine Translation	CodeCode Available	0
An Expanded Massive Multilingual Dataset for High-Performance Language Technologies	Mar 13, 2025	Machine TranslationSentence	CodeCode Available	0
Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models	Mar 12, 2025	Cross-Lingual TransferImage Captioning	—Unverified	0
Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval	Mar 12, 2025	Machine TranslationRetrieval	CodeCode Available	0
Explicit Learning and the LLM in Machine Translation	Mar 12, 2025	Machine TranslationTranslation	CodeCode Available	0
Contextual Cues in Machine Translation: Investigating the Potential of Multi-Source Input Strategies in LLMs and NMT Systems	Mar 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Cross-Lingual IPA Contrastive Learning for Zero-Shot NER	Mar 10, 2025	Contrastive LearningMachine Translation	—Unverified	0
Beyond Decoder-only: Large Language Models Can be Good Encoders for Machine Translation	Mar 9, 2025	DecoderMachine Translation	CodeCode Available	1
Assumed Identities: Quantifying Gender Bias in Machine Translation of Gender-Ambiguous Occupational Terms	Mar 6, 2025	BenchmarkingMachine Translation	—Unverified	0
Comparative Study of Zero-Shot Cross-Lingual Transfer for Bodo POS and NER Tagging Using Gemini 2.0 Flash Thinking Experimental Model	Mar 6, 2025	Cross-Lingual TransferMachine Translation	—Unverified	0
The Box is in the Pen: Evaluating Commonsense Reasoning in Neural Machine Translation	Mar 5, 2025	Common Sense ReasoningMachine Translation	CodeCode Available	0
Visualising Policy-Reward Interplay to Inform Zeroth-Order Preference Optimisation of Large Language Models	Mar 5, 2025	Machine Translation	CodeCode Available	0
Open-Source Large Language Models as Multilingual Crowdworkers: Synthesizing Open-Domain Dialogues in Several Languages With No Examples in Targets and No Machine Translation	Mar 5, 2025	Machine Translation	—Unverified	0
FourierNAT: A Fourier-Mixing-Based Non-Autoregressive Transformer for Parallel Sequence Generation	Mar 4, 2025	DecoderMachine Translation	—Unverified	0
BatchGEMBA: Token-Efficient Machine Translation Evaluation with Batched Prompting and Prompt Compression	Mar 4, 2025	Large Language ModelMachine Translation	CodeCode Available	0
Wikipedia in the Era of LLMs: Evolution and Risks	Mar 4, 2025	ArticlesMachine Translation	CodeCode Available	0
QE4PE: Word-level Quality Estimation for Human Post-Editing	Mar 4, 2025	Machine TranslationTranslation	CodeCode Available	0
Direct Speech to Speech Translation: A Review	Mar 3, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Co-creation for Sign Language Processing and Machine Translation	Mar 3, 2025	ArticlesMachine Translation	—Unverified	0

Show:10 25 50

← PrevPage 3 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified