Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 10752 papers

Title	Date	Tasks	Status	Hype
One Model is All You Need: ByT5-Sanskrit, a Unified Model for Sanskrit NLP Tasks	Sep 20, 2024	AllDependency Parsing	CodeCode Available	1
Guardians of the Machine Translation Meta-Evaluation: Sentinel Metrics Fall In!	Aug 25, 2024	FairnessMachine Translation	CodeCode Available	1
Language-Informed Beam Search Decoding for Multilingual Machine Translation	Aug 11, 2024	Language IdentificationMachine Translation	CodeCode Available	1
Investigating Sparsity in Recurrent Neural Networks	Jul 30, 2024	Machine TranslationNetwork Pruning	CodeCode Available	1
Learning Program Behavioral Models from Synthesized Input-Output Pairs	Jul 11, 2024	Machine Translation	CodeCode Available	1
Translatotron-V(ison): An End-to-End Model for In-Image Machine Translation	Jul 3, 2024	DecoderMachine Translation	CodeCode Available	1
Prompt Refinement with Image Pivot for Text-to-Image Generation	Jun 28, 2024	Image GenerationMachine Translation	CodeCode Available	1
ArzEn-LLM: Code-Switched Egyptian Arabic-English Translation and Speech Recognition Using LLMs	Jun 26, 2024	ArzEn Code-switched Translation to araArzEn Code-switched Translation to eng	CodeCode Available	1
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models	Jun 23, 2024	Machine TranslationMMLU	CodeCode Available	1
LLMs Are Zero-Shot Context-Aware Simultaneous Translators	Jun 19, 2024	Machine TranslationTranslation	CodeCode Available	1
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models Aligned with Human Cognitive Principles	Jun 18, 2024	Arithmetic ReasoningCode Generation	CodeCode Available	1
Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation	Jun 17, 2024	Machine TranslationTranslation	CodeCode Available	1
TasTe: Teaching Large Language Models to Translate through Self-Reflection	Jun 12, 2024	Instruction FollowingMachine Translation	CodeCode Available	1
CTC-based Non-autoregressive Textless Speech-to-Speech Translation	Jun 11, 2024	Knowledge DistillationMachine Translation	CodeCode Available	1
Agent-SiMT: Agent-assisted Simultaneous Machine Translation with Large Language Models	Jun 11, 2024	Machine TranslationSentence	CodeCode Available	1
Decoder-only Streaming Transformer for Simultaneous Translation	Jun 6, 2024	DecoderMachine Translation	CodeCode Available	1
MultiMax: Sparse and Multi-Modal Attention Learning	Jun 3, 2024	image-classificationImage Classification	CodeCode Available	1
QUEST: Quality-Aware Metropolis-Hastings Sampling for Machine Translation	May 28, 2024	DecoderMachine Translation	CodeCode Available	1
Advanced Language Model-based Translator for English-Vietnamese Translation	May 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
G-DIG: Towards Gradient-based Diverse and High-quality Instruction Data Selection for Machine Translation	May 21, 2024	DiversityMachine Translation	CodeCode Available	1
3AM: An Ambiguity-Aware Multi-Modal Machine Translation Dataset	Apr 29, 2024	Machine TranslationMultimodal Machine Translation	CodeCode Available	1
Setting up the Data Printer with Improved English to Ukrainian Machine Translation	Apr 23, 2024	DecoderLanguage Modeling	CodeCode Available	1
Bridging the Gap between Different Vocabularies for LLM Ensemble	Apr 15, 2024	Arithmetic ReasoningData-to-Text Generation	CodeCode Available	1
Guiding Large Language Models to Post-Edit Machine Translation with Error Annotations	Apr 11, 2024	Machine TranslationTranslation	CodeCode Available	1
Accelerating Inference in Large Language Models with a Unified Layer Skipping Strategy	Apr 10, 2024	Machine TranslationText Summarization	CodeCode Available	1
Large Language Models for Expansion of Spoken Language Understanding Systems to New Languages	Apr 3, 2024	Contrastive LearningMachine Translation	CodeCode Available	1
An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance	Apr 1, 2024	Machine TranslationTranslation	CodeCode Available	1
KazParC: Kazakh Parallel Corpus for Machine Translation	Mar 28, 2024	Machine TranslationTranslation	CodeCode Available	1
MAMMOTH: Massively Multilingual Modular Open Translation @ Helsinki	Mar 12, 2024	Machine TranslationPhilosophy	CodeCode Available	1
ALaRM: Align Language Models via Hierarchical Rewards Modeling	Mar 11, 2024	Long Form Question AnsweringMachine Translation	CodeCode Available	1
Language and Speech Technology for Central Kurdish Varieties	Mar 4, 2024	Automatic Speech RecognitionDiversity	CodeCode Available	1
Multi-objective Differentiable Neural Architecture Search	Feb 28, 2024	DecoderLanguage Modelling	CodeCode Available	1
XMoE: Sparse Models with Fine-grained and Adaptive Expert Selection	Feb 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
TMT: Tri-Modal Translation between Speech, Image, and Text by Processing Different Modalities as Different Languages	Feb 25, 2024	DecoderMachine Translation	CodeCode Available	1
SiLLM: Large Language Models for Simultaneous Machine Translation	Feb 20, 2024	Machine TranslationSentence	CodeCode Available	1
Inducing Systematicity in Transformers by Attending to Structurally Quantized Embeddings	Feb 9, 2024	Machine TranslationQuantization	CodeCode Available	1
TransLLaMa: LLM-based Simultaneous Translation System	Feb 7, 2024	DecoderMachine Translation	CodeCode Available	1
Non-Exchangeable Conformal Language Generation with Nearest Neighbors	Feb 1, 2024	Conformal PredictionLanguage Modeling	CodeCode Available	1
MT-Ranker: Reference-free machine translation evaluation by inter-system ranking	Jan 30, 2024	Machine TranslationNatural Language Inference	CodeCode Available	1
Machine Translation Meta Evaluation through Translation Accuracy Challenge Sets	Jan 29, 2024	BenchmarkingMachine Translation	CodeCode Available	1
Improving Machine Translation with Human Feedback: An Exploration of Quality Estimation as a Reward Model	Jan 23, 2024	Machine TranslationTranslation	CodeCode Available	1
Building Efficient and Effective OpenQA Systems for Low-Resource Languages	Jan 7, 2024	Machine TranslationQuestion Answering	CodeCode Available	1
LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models	Jan 1, 2024	Code GenerationIn-Context Learning	CodeCode Available	1
Fine-tuning Large Language Models for Adaptive Machine Translation	Dec 20, 2023	In-Context LearningLanguage Modelling	CodeCode Available	1
Cached Transformers: Improving Transformers with Differentiable Memory Cache	Dec 20, 2023	image-classificationImage Classification	CodeCode Available	1
Prompt Optimization via Adversarial In-Context Learning	Dec 5, 2023	Arithmetic ReasoningData-to-Text Generation	CodeCode Available	1
Ascle: A Python Natural Language Processing Toolkit for Medical Text Generation	Nov 28, 2023	Machine TranslationQuestion Answering	CodeCode Available	1
A Benchmark for Evaluating Machine Translation Metrics on Dialects Without Standard Orthography	Nov 28, 2023	Machine TranslationText Generation	CodeCode Available	1
Increasing Coverage and Precision of Textual Information in Multilingual Knowledge Graphs	Nov 27, 2023	Entity LinkingKnowledge Graph Completion	CodeCode Available	1
OpusCleaner and OpusTrainer, open source toolkits for training Machine Translation and Large language models	Nov 24, 2023	Data AugmentationMachine Translation	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified