Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 10752 papers

Title	Date	Tasks	Status	Hype
HiMATE: A Hierarchical Multi-Agent Framework for Machine Translation Evaluation	May 22, 2025	Machine TranslationTranslation	—Unverified	0
HOFT: Householder Orthogonal Fine-tuning	May 22, 2025	Machine TranslationMathematical Reasoning	—Unverified	0
In-Domain African Languages Translation Using LLMs and Multi-armed Bandits	May 21, 2025	Domain AdaptationMachine Translation	—Unverified	0
Exploring In-Image Machine Translation with Real-World Background	May 21, 2025	Machine TranslationTranslation	CodeCode Available	0
TransBench: Benchmarking Machine Translation for Industrial-Scale Applications	May 20, 2025	BenchmarkingMachine Translation	—Unverified	0
Pivot Language for Low-Resource Machine Translation	May 20, 2025	Machine TranslationTranslation	—Unverified	0
HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing	May 20, 2025	Language ModelingLanguage Modelling	—Unverified	0
Scaling Low-Resource MT via Synthetic Data Generation with LLMs	May 20, 2025	Machine TranslationSynthetic Data Generation	—Unverified	0
FuxiMT: Sparsifying Large Language Models for Chinese-Centric Multilingual Machine Translation	May 20, 2025	Language ModelingLanguage Modelling	—Unverified	0
THOR-MoE: Hierarchical Task-Guided and Context-Responsive Routing for Neural Machine Translation	May 20, 2025	Machine TranslationMixture-of-Experts	—Unverified	0
Combining the Best of Both Worlds: A Method for Hybrid NMT and LLM Translation	May 19, 2025	Language ModelingLanguage Modelling	—Unverified	0
A Case Study of Cross-Lingual Zero-Shot Generalization for Classical Languages in LLMs	May 19, 2025	Machine Translationnamed-entity-recognition	CodeCode Available	0
ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning	May 19, 2025	Machine Translationreinforcement-learning	CodeCode Available	3
LLM-Based Evaluation of Low-Resource Machine Translation: A Reference-less Dialect Guided Approach with a Refined Sylheti-English Benchmark	May 18, 2025	Machine TranslationSentence	CodeCode Available	0
Towards Cultural Bridge by Bahnaric-Vietnamese Translation Using Transfer Learning of Sequence-To-Sequence Pre-training Language Model	May 16, 2025	Data AugmentationLanguage Modeling	—Unverified	0
Multilingual Machine Translation with Quantum Encoder Decoder Attention-based Convolutional Variational Circuits	May 14, 2025	DecoderMachine Translation	—Unverified	0
Aya Vision: Advancing the Frontier of Multilingual Multimodality	May 13, 2025	Machine Translation	—Unverified	0
Are We Paying Attention to Her? Investigating Gender Disambiguation and Attention in Machine Translation	May 13, 2025	Machine TranslationNMT	CodeCode Available	0
Development of a WAZOBIA-Named Entity Recognition System	May 10, 2025	Machine Translationnamed-entity-recognition	—Unverified	0
TopicVD: A Topic-Based Dataset of Video-Guided Multimodal Machine Translation for Documentaries	May 9, 2025	Domain AdaptationMachine Translation	CodeCode Available	0
Do Not Change Me: On Transferring Entities Without Modification in Neural Machine Translation -- a Multilingual Perspective	May 9, 2025	Machine TranslationNMT	CodeCode Available	0
LiTransProQA: an LLM-based Literary Translation evaluation metric with Professional Question Answering	May 8, 2025	Machine TranslationQuestion Answering	CodeCode Available	0
Data Augmentation With Back translation for Low Resource languages: A case of English and Luganda	May 5, 2025	Data AugmentationMachine Translation	—Unverified	0
SignSplat: Rendering Sign Language via Gaussian Splatting	May 4, 2025	Machine Translation	—Unverified	0
Same evaluation, more tokens: On the effect of input length for machine translation evaluation using Large Language Models	May 3, 2025	Machine TranslationSentence	—Unverified	0
AI agents may be worth the hype but not the resources (yet): An initial exploration of machine translation quality and costs in three language pairs in the legal and news domains	May 2, 2025	Machine TranslationNMT	—Unverified	0
Sadeed: Advancing Arabic Diacritization Through Small Language Model	Apr 30, 2025	Arabic Text DiacritizationBenchmarking	—Unverified	0
Improving Retrieval-Augmented Neural Machine Translation with Monolingual Data	Apr 30, 2025	Machine TranslationRetrieval	—Unverified	0
Team ACK at SemEval-2025 Task 2: Beyond Word-for-Word Machine Translation for English-Korean Pairs	Apr 29, 2025	Machine TranslationTask 2	—Unverified	0
DMDTEval: An Evaluation and Analysis of LLMs on Disambiguation in Multi-domain Translation	Apr 29, 2025	Machine TranslationTranslation	—Unverified	0
Can LLMs Detect Intrinsic Hallucinations in Paraphrasing and Machine Translation?	Apr 29, 2025	HallucinationMachine Translation	—Unverified	0
Calibrating Translation Decoding with Quality Estimation on LLMs	Apr 26, 2025	2kMachine Translation	CodeCode Available	0
MEDIBENG WHISPER TINY: A FINE-TUNED CODE-SWITCHED BENGALI-ENGLISH TRANSLATOR FOR CLINICAL APPLICATIONS	Apr 25, 2025	Clinical Language TranslationMachine Translation	CodeCode Available	1
CLIRudit: Cross-Lingual Information Retrieval of Scientific Documents	Apr 22, 2025	BenchmarkingCross-Lingual Information Retrieval	—Unverified	0
FairTranslate: An English-French Dataset for Gender Bias Evaluation in Machine Translation by Overcoming Gender Binarity	Apr 22, 2025	Machine TranslationSentence	CodeCode Available	0
Automatic Evaluation Metrics for Document-level Translation: Overview, Challenges and Trends	Apr 21, 2025	Machine TranslationSentence	—Unverified	0
Trans-Zero: Self-Play Incentivizes Large Language Models for Multilingual Translation Without Parallel Data	Apr 20, 2025	Machine TranslationTranslation	CodeCode Available	0
Translation Analytics for Freelancers: I. Introduction, Data Preparation, Baseline Evaluations	Apr 20, 2025	Machine TranslationTranslation	—Unverified	0
A Multimodal Recaptioning Framework to Account for Perceptual Diversity in Multilingual Vision-Language Modeling	Apr 19, 2025	DiversityImage Retrieval	—Unverified	0
Remedy: Learning Machine Translation Evaluation from Human Preferences with Reward Modeling	Apr 18, 2025	Machine TranslationTranslation	CodeCode Available	1
Are AI agents the new machine translation frontier? Challenges and opportunities of single- and multi-agent systems for multilingual digital communication	Apr 17, 2025	Machine TranslationTranslation	—Unverified	0
ADAT: Time-Series-Aware Adaptive Transformer Architecture for Sign Language Translation	Apr 16, 2025	DecoderMachine Translation	—Unverified	0
Multilingual Contextualization of Large Language Models for Document-Level Machine Translation	Apr 16, 2025	Document Level Machine TranslationDocument Translation	—Unverified	0
Déjà Vu: Multilingual LLM Evaluation through the Lens of Machine Translation Evaluation	Apr 16, 2025	Machine Translation	—Unverified	0
AskQE: Question Answering as Automatic Evaluation for Machine Translation	Apr 15, 2025	Machine TranslationQuestion Answering	—Unverified	0
Automated Python Translation	Apr 15, 2025	Machine TranslationTranslation	—Unverified	0
MorphTok: Morphologically Grounded Tokenization for Indian Languages	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified	0
MT-R1-Zero: Advancing LLM-based Machine Translation via R1-Zero-like Reinforcement Learning	Apr 14, 2025	Machine TranslationReinforcement Learning (RL)	CodeCode Available	2
LLMs Can Achieve High-quality Simultaneous Machine Translation as Efficiently as Offline	Apr 13, 2025	Machine TranslationSentence	CodeCode Available	0
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs	Apr 13, 2025	BelebeleMachine Translation	CodeCode Available	0

Show:10 25 50

← PrevPage 2 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified