Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6550 of 10752 papers

Title	Date	Tasks	Status	Hype
Neural Caption Generation for News Images	May 1, 2018	Caption GenerationImage Captioning	—Unverified	0
A Framework for the Needs of Different Types of Users in Multilingual Semantic Enrichment	May 1, 2018	Entity LinkingMachine Translation	—Unverified	0
On the Vector Representation of Utterances in Dialogue Context	May 1, 2018	Document ClassificationIntent Detection	—Unverified	0
A corpus of German political speeches from the 21st century	May 1, 2018	Keyword ExtractionMachine Translation	—Unverified	0
Managing Public Sector Data for Multilingual Applications Development	May 1, 2018	Machine Translation	—Unverified	0
Unsupervised Korean Word Sense Disambiguation using CoreNet	May 1, 2018	Dependency ParsingMachine Translation	—Unverified	0
AET: Web-based Adjective Exploration Tool for German	May 1, 2018	Machine Translation	—Unverified	0
Developing the Bangla RST Discourse Treebank	May 1, 2018	Machine TranslationSentiment Analysis	—Unverified	0
Translation Crowdsourcing: Creating a Multilingual Corpus of Online Educational Content	May 1, 2018	Machine TranslationTranslation	—Unverified	0
Very Large-Scale Lexical Resources to Enhance Chinese and Japanese Machine Translation	May 1, 2018	LemmatizationMachine Translation	—Unverified	0
No more beating about the bush : A Step towards Idiom Handling for Indian Language NLP	May 1, 2018	Machine TranslationQuestion Answering	—Unverified	0
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified	0
Language adaptation experiments via cross-lingual embeddings for related languages	May 1, 2018	Domain AdaptationInformation Retrieval	—Unverified	0
Word Embedding Approach for Synonym Extraction of Multi-Word Terms	May 1, 2018	Information RetrievalMachine Translation	CodeCode Available	0
Automatic Enrichment of Terminological Resources: the IATE RDF Example	May 1, 2018	Machine TranslationWord Sense Disambiguation	—Unverified	0
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified	0
Investigating the Influence of Bilingual MWU on Trainee Translation Quality	May 1, 2018	Machine TranslationTranslation	—Unverified	0
OpenSubtitles2018: Statistical Rescoring of Sentence Alignments in Large, Noisy Parallel Corpora	May 1, 2018	Machine TranslationSentence	—Unverified	0
ParCorFull: a Parallel Corpus Annotated with Full Coreference	May 1, 2018	Coreference ResolutionMachine Translation	—Unverified	0
Crowdsourced Corpus of Sentence Simplification with Core Vocabulary	May 1, 2018	Machine TranslationSentence	—Unverified	0
Creating a Translation Matrix of the Bible's Names Across 591 Languages	May 1, 2018	Entity AlignmentMachine Translation	CodeCode Available	0
Attention for Implicit Discourse Relation Recognition	May 1, 2018	Coreference ResolutionFeature Engineering	—Unverified	0
CPJD Corpus: Crowdsourced Parallel Speech Corpus of Japanese Dialects	May 1, 2018	Machine TranslationSpeech Recognition	—Unverified	0
TQ-AutoTest -- An Automated Test Suite for (Machine) Translation Quality	May 1, 2018	Machine TranslationTranslation	—Unverified	0
The LREC Workshops Map	May 1, 2018	Machine Translation	—Unverified	0
Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods	May 1, 2018	ArticlesGrammatical Error Correction	—Unverified	0
A Multilingual Wikified Data Set of Educational Material	May 1, 2018	Cross-Lingual Semantic Textual SimilarityMachine Translation	—Unverified	0
The GermaParl Corpus of Parliamentary Protocols	May 1, 2018	Decision MakingMachine Translation	—Unverified	0
A Comparative Study of Extremely Low-Resource Transliteration of the World's Languages	May 1, 2018	Machine TranslationSpeech Recognition	—Unverified	0
A Taxonomy for In-depth Evaluation of Normalization for User Generated Content	May 1, 2018	Grammatical Error CorrectionLexical Normalization	—Unverified	0
SoMeWeTa: A Part-of-Speech Tagger for German Social Media and Web Texts	May 1, 2018	Domain AdaptationLemmatization	CodeCode Available	0
Handling Rare Word Problem using Synthetic Training Data for Sinhala and Tamil Neural Machine Translation	May 1, 2018	Data AugmentationMachine Translation	—Unverified	0
SPADE: Evaluation Dataset for Monolingual Phrase Alignment	May 1, 2018	Machine TranslationParaphrase Identification	—Unverified	0
Parallel Corpora for the Biomedical Domain	May 1, 2018	Information RetrievalMachine Translation	CodeCode Available	1
Dynamic Sentence Sampling for Efficient Training of Neural Machine Translation	May 1, 2018	Machine TranslationNMT	—Unverified	0
Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT	May 1, 2018	Machine TranslationNMT	—Unverified	0
Subword Regularization: Improving Neural Network Translation Models with Multiple Subword Candidates	Apr 29, 2018	Language ModelingLanguage Modelling	CodeCode Available	0
Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese	Apr 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Optimus: An Efficient Dynamic Resource Scheduler for Deep Learning Clusters	Apr 26, 2018	CPUDeep Learning	CodeCode Available	0
TNT-NLG, System 1: Using a statistical NLG to massively augment crowd-sourced data for neural generation	Apr 26, 2018	Data-to-Text GenerationMachine Translation	—Unverified	0
The Best of Both Worlds: Combining Recent Advances in Neural Machine Translation	Apr 26, 2018	Machine TranslationTranslation	CodeCode Available	2
On the Evaluation of Semantic Phenomena in Neural Machine Translation Using Natural Language Inference	Apr 25, 2018	Machine TranslationNatural Language Inference	CodeCode Available	1
Unsupervised Neural Machine Translation with Weight Sharing	Apr 24, 2018	Machine TranslationNMT	CodeCode Available	0
Scheduled Multi-Task Learning: From Syntax to Translation	Apr 24, 2018	DecoderMachine Translation	—Unverified	0
QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension	Apr 23, 2018	Machine TranslationQuestion Answering	CodeCode Available	1
Exploiting Semantics in Neural Machine Translation with Graph Convolutional Networks	Apr 23, 2018	Machine TranslationSentence	—Unverified	0
BrainSlug: Transparent Acceleration of Deep Learning Through Depth-First Parallelism	Apr 23, 2018	Deep LearningMachine Translation	—Unverified	0
Bilingual Embeddings with Random Walks over Multilingual Wordnets	Apr 23, 2018	Machine TranslationWord Embeddings	—Unverified	0
A neural interlingua for multilingual machine translation	Apr 23, 2018	DecoderMachine Translation	—Unverified	0
A Call for Clarity in Reporting BLEU Scores	Apr 23, 2018	Machine TranslationTranslation	CodeCode Available	0

Show:10 25 50

← PrevPage 131 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified