Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 10752 papers

Title	Date	Tasks	Status	Hype
Ties Matter: Meta-Evaluating Modern Metrics with Pairwise Accuracy and Tie Calibration	May 23, 2023	Machine Translation	CodeCode Available	1
BigVideo: A Large-scale Video Subtitle Translation Dataset for Multimodal Machine Translation	May 23, 2023	Contrastive LearningMachine Translation	CodeCode Available	1
Sāmayik: A Benchmark and Dataset for English-Sanskrit Translation	May 23, 2023	Machine TranslationTranslation	CodeCode Available	1
WYWEB: A NLP Evaluation Benchmark For Classical Chinese	May 23, 2023	Machine TranslationNatural Language Understanding	CodeCode Available	1
Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models	May 22, 2023	Machine Translation	CodeCode Available	1
Explaining How Transformers Use Context to Build Predictions	May 21, 2023	Machine TranslationText Generation	CodeCode Available	1
Communication Efficient Federated Learning for Multilingual Neural Machine Translation with Adapter	May 21, 2023	ClusteringFederated Learning	CodeCode Available	1
Scene Graph as Pivoting: Inference-time Image-free Unsupervised Multimodal Machine Translation with Visual Scene Hallucination	May 20, 2023	HallucinationMachine Translation	CodeCode Available	1
DUB: Discrete Unit Back-translation for Speech Translation	May 19, 2023	Machine TranslationSpeech-to-Text	CodeCode Available	1
Discourse Centric Evaluation of Machine Translation with a Densely Annotated Parallel Corpus	May 18, 2023	Machine TranslationSentence	CodeCode Available	1
Epsilon Sampling Rocks: Investigating Sampling Strategies for Minimum Bayes Risk Decoding for Machine Translation	May 17, 2023	Machine Translation	CodeCode Available	1
xPQA: Cross-Lingual Product Question Answering across 12 Languages	May 16, 2023	Answer GenerationMachine Translation	CodeCode Available	1
AR-Diffusion: Auto-Regressive Diffusion Model for Text Generation	May 16, 2023	Common Sense ReasoningDenoising	CodeCode Available	1
Back Translation for Speech-to-text Translation Without Transcripts	May 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Understanding and Bridging the Modality Gap for Speech Translation	May 15, 2023	Machine TranslationMulti-Task Learning	CodeCode Available	1
Improving Zero-shot Multilingual Neural Machine Translation by Leveraging Cross-lingual Consistency Regularization	May 12, 2023	Machine TranslationNMT	CodeCode Available	1
Target-Side Augmentation for Document-Level Machine Translation	May 8, 2023	Data AugmentationDocument Level Machine Translation	CodeCode Available	1
MultiTACRED: A Multilingual Version of the TAC Relation Extraction Dataset	May 8, 2023	Machine TranslationRelation	CodeCode Available	1
Lift Yourself Up: Retrieval-augmented Text Generation with Self Memory	May 3, 2023	Abstractive Text SummarizationDialogue Generation	CodeCode Available	1
SLTUNET: A Simple Unified Model for Sign Language Translation	May 2, 2023	Machine TranslationSign Language Translation	CodeCode Available	1
ResiDual: Transformer with Dual Residual Connections	Apr 28, 2023	Machine Translation	CodeCode Available	1
ICE-Score: Instructing Large Language Models to Evaluate Code	Apr 27, 2023	Code GenerationMachine Translation	CodeCode Available	1
Directed Acyclic Transformer Pre-training for High-quality Non-autoregressive Text Generation	Apr 24, 2023	Machine TranslationText Generation	CodeCode Available	1
MasakhaNEWS: News Topic Classification for African languages	Apr 19, 2023	ClassificationFew-Shot Learning	CodeCode Available	1
Angler: Helping Machine Translation Practitioners Prioritize Model Improvements	Apr 12, 2023	Machine Translationmodel	CodeCode Available	1
Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis	Apr 10, 2023	Machine TranslationTranslation	CodeCode Available	1
ParroT: Translating during Chat using Large Language Models tuned with Human Translation and Feedback	Apr 5, 2023	Instruction FollowingMachine Translation	CodeCode Available	1
Document-Level Machine Translation with Large Language Models	Apr 5, 2023	Document Level Machine TranslationMachine Translation	CodeCode Available	1
Hallucinations in Large Multilingual Translation Models	Mar 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models	Mar 24, 2023	Machine TranslationNatural Language Understanding	CodeCode Available	1
Towards Making the Most of ChatGPT for Machine Translation	Mar 24, 2023	In-Context LearningMachine Translation	CodeCode Available	1
Fuzzy Alignments in Directed Acyclic Graph for Non-Autoregressive Machine Translation	Mar 12, 2023	Machine TranslationSentence	CodeCode Available	1
ZeroNLG: Aligning and Autoencoding Domains for Zero-Shot Multimodal and Multilingual Natural Language Generation	Mar 11, 2023	Image CaptioningImage to text	CodeCode Available	1
MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition	Mar 9, 2023	Lip ReadingMachine Translation	CodeCode Available	1
Investigating the Translation Performance of a Large Multilingual Language Model: the Case of BLOOM	Mar 3, 2023	Cross-Lingual TransferLanguage Modeling	CodeCode Available	1
Hidden Markov Transformer for Simultaneous Machine Translation	Mar 1, 2023	Machine TranslationTranslation	CodeCode Available	1
kNN-BOX: A Unified Framework for Nearest Neighbor Generation	Feb 27, 2023	Machine TranslationParaphrase Generation	CodeCode Available	1
Simple and Scalable Nearest Neighbor Machine Translation	Feb 23, 2023	Domain AdaptationMachine Translation	CodeCode Available	1
Zero and Few-Shot Localization of Task-Oriented Dialogue Agents with a Distilled Representation	Feb 18, 2023	Dialogue State TrackingMachine Translation	CodeCode Available	1
How Good Are GPT Models at Machine Translation? A Comprehensive Evaluation	Feb 18, 2023	Machine TranslationText Generation	CodeCode Available	1
Speculative Decoding with Big Little Decoder	Feb 15, 2023	Decoderde-en	CodeCode Available	1
A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity	Feb 8, 2023	Code GenerationHallucination	CodeCode Available	1
STEP: Learning N:M Structured Sparsity Masks from Scratch with Precondition	Feb 2, 2023	Machine Translation	CodeCode Available	1
Adaptive Machine Translation with Large Language Models	Jan 30, 2023	DecoderDomain Adaptation	CodeCode Available	1
Unsupervised Mandarin-Cantonese Machine Translation	Jan 10, 2023	Machine TranslationTranslation	CodeCode Available	1
Tsetlin Machine Embedding: Representing Words Using Logical Expressions	Jan 2, 2023	Document ClassificationMachine Translation	CodeCode Available	1
Tackling Ambiguity with Images: Improved Multimodal Machine Translation and Contrastive Evaluation	Dec 20, 2022	Machine TranslationMultimodal Machine Translation	CodeCode Available	1
Toward Human-Like Evaluation for Natural Language Generation with Error Analysis	Dec 20, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Lego-MT: Learning Detachable Models for Massively Multilingual Machine Translation	Dec 20, 2022	Machine TranslationTranslation	CodeCode Available	1
T-Projection: High Quality Annotation Projection for Sequence Labeling Tasks	Dec 20, 2022	Cross-Lingual NERMachine Translation	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified