Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 10752 papers

Title	Date	Tasks	Status
Comparative analysis of subword tokenization approaches for Indian languages	May 22, 2025	Machine TranslationTranslation	—Unverified
HOFT: Householder Orthogonal Fine-tuning	May 22, 2025	Machine TranslationMathematical Reasoning	—Unverified
In-Domain African Languages Translation Using LLMs and Multi-armed Bandits	May 21, 2025	Domain AdaptationMachine Translation	—Unverified
Exploring In-Image Machine Translation with Real-World Background	May 21, 2025	Machine TranslationTranslation	CodeCode Available
Pivot Language for Low-Resource Machine Translation	May 20, 2025	Machine TranslationTranslation	—Unverified
Scaling Low-Resource MT via Synthetic Data Generation with LLMs	May 20, 2025	Machine TranslationSynthetic Data Generation	—Unverified
HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing	May 20, 2025	Language ModelingLanguage Modelling	—Unverified
FuxiMT: Sparsifying Large Language Models for Chinese-Centric Multilingual Machine Translation	May 20, 2025	Language ModelingLanguage Modelling	—Unverified
TransBench: Benchmarking Machine Translation for Industrial-Scale Applications	May 20, 2025	BenchmarkingMachine Translation	—Unverified
THOR-MoE: Hierarchical Task-Guided and Context-Responsive Routing for Neural Machine Translation	May 20, 2025	Machine TranslationMixture-of-Experts	—Unverified
A Case Study of Cross-Lingual Zero-Shot Generalization for Classical Languages in LLMs	May 19, 2025	Machine Translationnamed-entity-recognition	CodeCode Available
Combining the Best of Both Worlds: A Method for Hybrid NMT and LLM Translation	May 19, 2025	Language ModelingLanguage Modelling	—Unverified
LLM-Based Evaluation of Low-Resource Machine Translation: A Reference-less Dialect Guided Approach with a Refined Sylheti-English Benchmark	May 18, 2025	Machine TranslationSentence	CodeCode Available
Towards Cultural Bridge by Bahnaric-Vietnamese Translation Using Transfer Learning of Sequence-To-Sequence Pre-training Language Model	May 16, 2025	Data AugmentationLanguage Modeling	—Unverified
Multilingual Machine Translation with Quantum Encoder Decoder Attention-based Convolutional Variational Circuits	May 14, 2025	DecoderMachine Translation	—Unverified
Are We Paying Attention to Her? Investigating Gender Disambiguation and Attention in Machine Translation	May 13, 2025	Machine TranslationNMT	CodeCode Available
Aya Vision: Advancing the Frontier of Multilingual Multimodality	May 13, 2025	Machine Translation	—Unverified
Development of a WAZOBIA-Named Entity Recognition System	May 10, 2025	Machine Translationnamed-entity-recognition	—Unverified
Do Not Change Me: On Transferring Entities Without Modification in Neural Machine Translation -- a Multilingual Perspective	May 9, 2025	Machine TranslationNMT	CodeCode Available
TopicVD: A Topic-Based Dataset of Video-Guided Multimodal Machine Translation for Documentaries	May 9, 2025	Domain AdaptationMachine Translation	CodeCode Available
LiTransProQA: an LLM-based Literary Translation evaluation metric with Professional Question Answering	May 8, 2025	Machine TranslationQuestion Answering	CodeCode Available
Data Augmentation With Back translation for Low Resource languages: A case of English and Luganda	May 5, 2025	Data AugmentationMachine Translation	—Unverified
SignSplat: Rendering Sign Language via Gaussian Splatting	May 4, 2025	Machine Translation	—Unverified
Same evaluation, more tokens: On the effect of input length for machine translation evaluation using Large Language Models	May 3, 2025	Machine TranslationSentence	—Unverified
AI agents may be worth the hype but not the resources (yet): An initial exploration of machine translation quality and costs in three language pairs in the legal and news domains	May 2, 2025	Machine TranslationNMT	—Unverified
Sadeed: Advancing Arabic Diacritization Through Small Language Model	Apr 30, 2025	Arabic Text DiacritizationBenchmarking	—Unverified
Improving Retrieval-Augmented Neural Machine Translation with Monolingual Data	Apr 30, 2025	Machine TranslationRetrieval	—Unverified
DMDTEval: An Evaluation and Analysis of LLMs on Disambiguation in Multi-domain Translation	Apr 29, 2025	Machine TranslationTranslation	—Unverified
Can LLMs Detect Intrinsic Hallucinations in Paraphrasing and Machine Translation?	Apr 29, 2025	HallucinationMachine Translation	—Unverified
Team ACK at SemEval-2025 Task 2: Beyond Word-for-Word Machine Translation for English-Korean Pairs	Apr 29, 2025	Machine TranslationTask 2	—Unverified
Calibrating Translation Decoding with Quality Estimation on LLMs	Apr 26, 2025	2kMachine Translation	CodeCode Available
CLIRudit: Cross-Lingual Information Retrieval of Scientific Documents	Apr 22, 2025	BenchmarkingCross-Lingual Information Retrieval	—Unverified
FairTranslate: An English-French Dataset for Gender Bias Evaluation in Machine Translation by Overcoming Gender Binarity	Apr 22, 2025	Machine TranslationSentence	CodeCode Available
Automatic Evaluation Metrics for Document-level Translation: Overview, Challenges and Trends	Apr 21, 2025	Machine TranslationSentence	—Unverified
Trans-Zero: Self-Play Incentivizes Large Language Models for Multilingual Translation Without Parallel Data	Apr 20, 2025	Machine TranslationTranslation	CodeCode Available
Translation Analytics for Freelancers: I. Introduction, Data Preparation, Baseline Evaluations	Apr 20, 2025	Machine TranslationTranslation	—Unverified
A Multimodal Recaptioning Framework to Account for Perceptual Diversity in Multilingual Vision-Language Modeling	Apr 19, 2025	DiversityImage Retrieval	—Unverified
Are AI agents the new machine translation frontier? Challenges and opportunities of single- and multi-agent systems for multilingual digital communication	Apr 17, 2025	Machine TranslationTranslation	—Unverified
Déjà Vu: Multilingual LLM Evaluation through the Lens of Machine Translation Evaluation	Apr 16, 2025	Machine Translation	—Unverified
Multilingual Contextualization of Large Language Models for Document-Level Machine Translation	Apr 16, 2025	Document Level Machine TranslationDocument Translation	—Unverified
ADAT: Time-Series-Aware Adaptive Transformer Architecture for Sign Language Translation	Apr 16, 2025	DecoderMachine Translation	—Unverified
AskQE: Question Answering as Automatic Evaluation for Machine Translation	Apr 15, 2025	Machine TranslationQuestion Answering	—Unverified
Automated Python Translation	Apr 15, 2025	Machine TranslationTranslation	—Unverified
MorphTok: Morphologically Grounded Tokenization for Indian Languages	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs	Apr 13, 2025	BelebeleMachine Translation	CodeCode Available
LLMs Can Achieve High-quality Simultaneous Machine Translation as Efficiently as Offline	Apr 13, 2025	Machine TranslationSentence	CodeCode Available
Large Language Models as Span Annotators	Apr 11, 2025	Data-to-Text GenerationMachine Translation	—Unverified
Context-Aware Monolingual Human Evaluation of Machine Translation	Apr 10, 2025	Machine TranslationTranslation	—Unverified
Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Scalable Automated Assessment with LLM-as-a-Judge	Apr 10, 2025	Adversarial RobustnessBenchmarking	CodeCode Available
Redefining Machine Translation on Social Network Services with Large Language Models	Apr 10, 2025	Machine TranslationTranslation	CodeCode Available

Show:10 25 50

← PrevPage 19 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified