Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 10752 papers

Title	Date	Tasks	Status	Hype
A Resource for Computational Experiments on Mapudungun	Dec 4, 2019	Machine Translationspeech-recognition	CodeCode Available	1
BigVideo: A Large-scale Video Subtitle Translation Dataset for Multimodal Machine Translation	May 23, 2023	Contrastive LearningMachine Translation	CodeCode Available	1
Adaptive Nearest Neighbor Machine Translation	May 27, 2021	Machine TranslationNMT	CodeCode Available	1
Bilingual Mutual Information Based Adaptive Training for Neural Machine Translation	May 26, 2021	DiversityMachine Translation	CodeCode Available	1
ArzEn-LLM: Code-Switched Egyptian Arabic-English Translation and Speech Recognition Using LLMs	Jun 26, 2024	ArzEn Code-switched Translation to araArzEn Code-switched Translation to eng	CodeCode Available	1
Bi-SimCut: A Simple Strategy for Boosting Neural Machine Translation	Jun 6, 2022	de-enMachine Translation	CodeCode Available	1
BLEU might be Guilty but References are not Innocent	Apr 13, 2020	DiversityMachine Translation	CodeCode Available	1
Block Pruning For Faster Transformers	Sep 10, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
A Sketch-Based Neural Model for Generating Commit Messages from Diffs	Apr 8, 2021	Code GenerationDescriptive	CodeCode Available	1
Bridging the Gap between Different Vocabularies for LLM Ensemble	Apr 15, 2024	Arithmetic ReasoningData-to-Text Generation	CodeCode Available	1
Building Efficient and Effective OpenQA Systems for Low-Resource Languages	Jan 7, 2024	Machine TranslationQuestion Answering	CodeCode Available	1
Cached Transformers: Improving Transformers with Differentiable Memory Cache	Dec 20, 2023	image-classificationImage Classification	CodeCode Available	1
Can Language Models Make Fun? A Case Study in Chinese Comical Crosstalk	Jul 2, 2022	BenchmarkingMachine Translation	CodeCode Available	1
Can We Generate Shellcodes via Natural Language? An Empirical Study	Feb 8, 2022	Code GenerationMachine Translation	CodeCode Available	1
CAPIVARA: Cost-Efficient Approach for Improving Multilingual CLIP Performance on Low-Resource Languages	Oct 20, 2023	DiversityGPU	CodeCode Available	1
Rethinking Document-level Neural Machine Translation	Oct 18, 2020	Document TranslationMachine Translation	CodeCode Available	1
AMR Similarity Metrics from Principles	Jan 29, 2020	Abstract Meaning RepresentationComputational Efficiency	CodeCode Available	1
AR-Diffusion: Auto-Regressive Diffusion Model for Text Generation	May 16, 2023	Common Sense ReasoningDenoising	CodeCode Available	1
ChrEn: Cherokee-English Machine Translation for Endangered Language Revitalization	Oct 9, 2020	Cultural Vocal Bursts Intensity PredictionLanguage Modelling	CodeCode Available	1
ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality Estimation and Corrective Feedback	Jul 30, 2021	Machine TranslationNMT	CodeCode Available	1
CMOT: Cross-modal Mixup via Optimal Transport for Speech Translation	May 24, 2023	Machine TranslationTranslation	CodeCode Available	1
CoCoA-MT: A Dataset and Benchmark for Contrastive Controlled MT with Application to Formality	May 9, 2022	Machine TranslationSentence	CodeCode Available	1
CodeTransOcean: A Comprehensive Multilingual Benchmark for Code Translation	Oct 8, 2023	Code TranslationMachine Translation	CodeCode Available	1
Collecting a Large-Scale Gender Bias Dataset for Coreference Resolution and Machine Translation	Sep 8, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1
Arch-Net: Model Distillation for Architecture Agnostic Model Deployment	Nov 1, 2021	image-classificationImage Classification	CodeCode Available	1
A Multilingual Neural Machine Translation Model for Biomedical Data	Aug 6, 2020	Machine TranslationTranslation	CodeCode Available	1
A Reinforcement Learning Based Encoder-Decoder Framework for Learning Stock Trading Rules	Jan 8, 2021	DecoderDeep Reinforcement Learning	CodeCode Available	1
Context-Aware Monolingual Repair for Neural Machine Translation	Sep 3, 2019	Automatic Post-EditingMachine Translation	CodeCode Available	1
Contextual Semantic Parsing for Multilingual Task-Oriented Dialogues	Nov 4, 2021	Dialogue State TrackingMachine Translation	CodeCode Available	1
Continuous Language Generative Flow	Aug 1, 2021	Data AugmentationDensity Estimation	CodeCode Available	1
Contrastive Learning with Adversarial Perturbations for Conditional Text Generation	Dec 14, 2020	Conditional Text GenerationContrastive Learning	CodeCode Available	1
A Parallel Evaluation Data Set of Software Documentation with Document Structure Annotation	Aug 11, 2020	Machine TranslationTranslation	CodeCode Available	1
Conversational Word Embedding for Retrieval-Based Dialog System	Apr 28, 2020	Common Sense ReasoningMachine Translation	CodeCode Available	1
Convolutional Sequence to Sequence Learning	May 8, 2017	Bangla Spelling Error CorrectionCPU	CodeCode Available	1
Counterfactual Data Augmentation for Neural Machine Translation	Jun 1, 2021	counterfactualData Augmentation	CodeCode Available	1
Coursera Corpus Mining and Multistage Fine-Tuning for Improving Lectures Translation	Dec 26, 2019	BenchmarkingDomain Adaptation	CodeCode Available	1
Adaptive Machine Translation with Large Language Models	Jan 30, 2023	DecoderDomain Adaptation	CodeCode Available	1
Cross-Lingual Adaptation using Structural Correspondence Learning	Aug 4, 2010	ClassificationDomain Adaptation	CodeCode Available	1
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models	Jun 23, 2024	Machine TranslationMMLU	CodeCode Available	1
Cross-Lingual Cross-Modal Retrieval with Noise-Robust Learning	Aug 26, 2022	Cross-Modal RetrievalMachine Translation	CodeCode Available	1
Picard understanding Darmok: A Dataset and Model for Metaphor-Rich Translation in a Constructed Language	Jul 16, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Data Augmentation for Low-Resource Neural Machine Translation	May 1, 2017	Data AugmentationLow Resource Neural Machine Translation	CodeCode Available	1
Data Rejuvenation: Exploiting Inactive Training Examples for Neural Machine Translation	Oct 6, 2020	Machine TranslationNMT	CodeCode Available	1
Decoder-only Streaming Transformer for Simultaneous Translation	Jun 6, 2024	DecoderMachine Translation	CodeCode Available	1
A Probabilistic Formulation of Unsupervised Text Style Transfer	Feb 10, 2020	DeciphermentLanguage Modelling	CodeCode Available	1
Defending Against Backdoor Attacks in Natural Language Generation	Jun 3, 2021	Backdoor AttackDialogue Generation	CodeCode Available	1
DeLighT: Deep and Light-weight Transformer	Aug 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
In-Context Explainers: Harnessing LLMs for Explaining Black Box Models	Oct 9, 2023	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	CodeCode Available	1
Designing the Business Conversation Corpus	Aug 5, 2020	Machine TranslationTranslation	CodeCode Available	1
As Little as Possible, as Much as Necessary: Detecting Over- and Undertranslations with Contrastive Conditioning	Mar 3, 2022	Machine TranslationTranslation	CodeCode Available	1

Show:10 25 50

← PrevPage 12 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified