Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6451–6500 of 10752 papers

Title	Date	Tasks	Status
Teanga: A Linked Data based platform for Natural Language Processing	May 1, 2018	Machine TranslationPart-Of-Speech Tagging	—Unverified
NegPar: A parallel corpus annotated for negation	May 1, 2018	Machine TranslationNegation	—Unverified
Designing a Russian Idiom-Annotated Corpus	May 1, 2018	Machine TranslationWord Embeddings	—Unverified
A Workbench for Rapid Generation of Cross-Lingual Summaries	May 1, 2018	Automatic Post-EditingMachine Translation	CodeCode Available
TF-LM: TensorFlow-based Language Modeling Toolkit	May 1, 2018	Language ModelingLanguage Modelling	CodeCode Available
Using English Baits to Catch Serbian Multi-Word Terminology	May 1, 2018	Machine TranslationMorphological Inflection	—Unverified
Language Technology for Multilingual Europe: An Analysis of a Large-Scale Survey regarding Challenges, Demands, Gaps and Needs	May 1, 2018	Machine Translation	—Unverified
Konbitzul: an MWE-specific database for Spanish-Basque	May 1, 2018	Machine Translation	—Unverified
Automatic Identification of Maghreb Dialects Using a Dictionary-Based Approach	May 1, 2018	Information RetrievalLanguage Identification	—Unverified
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified
Training and Adapting Multilingual NMT for Less-resourced and Morphologically Rich Languages	May 1, 2018	Machine TranslationNMT	CodeCode Available
SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages	May 1, 2018	Information RetrievalMachine Translation	—Unverified
Multimodal Lexical Translation	May 1, 2018	Machine TranslationMultimodal Lexical Translation	CodeCode Available
A Detailed Evaluation of Neural Sequence-to-Sequence Models for In-domain and Cross-domain Text Simplification	May 1, 2018	Machine TranslationText Simplification	—Unverified
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Text Simplification from Professionally Produced Corpora	May 1, 2018	Lexical SimplificationMachine Translation	—Unverified
Cross-lingual Terminology Extraction for Translation Quality Estimation	May 1, 2018	Machine TranslationTranslation	—Unverified
Augmenting Image Question Answering Dataset by Exploiting Image Captions	May 1, 2018	Data AugmentationImage Captioning	—Unverified
Creating Large-Scale Multilingual Cognate Tables	May 1, 2018	Machine TranslationSemantic Textual Similarity	CodeCode Available
Improving Machine Translation of Educational Content via Crowdsourcing	May 1, 2018	Machine TranslationTransfer Learning	—Unverified
Improving domain-specific SMT for low-resourced languages using data from different domains	May 1, 2018	Domain AdaptationLanguage Modeling	—Unverified
Improving a Neural-based Tagger for Multiword Expressions Identification	May 1, 2018	Dependency ParsingMachine Translation	—Unverified
WordNet-Shp: Towards the Building of a Lexical Database for a Peruvian Minority Language	May 1, 2018	Machine TranslationWord Sense Disambiguation	—Unverified
Unified Guidelines and Resources for Arabic Dialect Orthography	May 1, 2018	Machine TranslationSpeech Recognition	—Unverified
A Multilingual Dataset for Evaluating Parallel Sentence Extraction from Comparable Corpora	May 1, 2018	Machine TranslationSemantic Textual Similarity	—Unverified
A Morphologically Annotated Corpus of Emirati Arabic	May 1, 2018	LemmatizationMachine Translation	—Unverified
Towards a Standardized Dataset for Noun Compound Interpretation	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Risam\'alheild: A Very Large Icelandic Text Corpus	May 1, 2018	Machine Translation	—Unverified
Multilingual Parallel Corpus for Global Communication Plan	May 1, 2018	Domain AdaptationMachine Translation	—Unverified
Towards a Linked Open Data Edition of Sumerian Corpora	May 1, 2018	Machine Translation	—Unverified
Parallel Corpora in Mboshi (Bantu C25, Congo-Brazzaville)	May 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Generating a Gold Standard for a Swedish Sentiment Lexicon	May 1, 2018	LemmatizationMachine Translation	—Unverified
On the Vector Representation of Utterances in Dialogue Context	May 1, 2018	Document ClassificationIntent Detection	—Unverified
Combining Concepts and Their Translations from Structured Dictionaries of Uralic Minority Languages	May 1, 2018	Machine Translation	—Unverified
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified
TQ-AutoTest -- An Automated Test Suite for (Machine) Translation Quality	May 1, 2018	Machine TranslationTranslation	—Unverified
The LREC Workshops Map	May 1, 2018	Machine Translation	—Unverified
A Large Automatically-Acquired All-Words List of Multiword Expressions Scored for Compositionality	May 1, 2018	AllInformation Retrieval	—Unverified
Exploiting Pre-Ordering for Neural Machine Translation	May 1, 2018	Machine TranslationTranslation	—Unverified
Tilde MT Platform for Developing Client Specific MT Solutions	May 1, 2018	Common Sense ReasoningMachine Translation	—Unverified
Evaluating Domain Adaptation for Machine Translation Across Scenarios	May 1, 2018	Domain AdaptationMachine Translation	—Unverified
European Language Resource Coordination: Collecting Language Resources for Public Sector Multilingual Information Management	May 1, 2018	Machine TranslationManagement	—Unverified
A Hybrid Approach for Automatic Extraction of Bilingual Multiword Expressions from Parallel Corpora	May 1, 2018	Domain AdaptationInformation Retrieval	—Unverified
Building a Macro Chinese Discourse Treebank	May 1, 2018	Information RetrievalMachine Translation	—Unverified
Building A Handwritten Cuneiform Character Imageset	May 1, 2018	Machine TranslationOptical Character Recognition (OCR)	—Unverified
A Parallel Corpus of Arabic-Japanese News Articles	May 1, 2018	ArticlesMachine Translation	—Unverified
SoMeWeTa: A Part-of-Speech Tagger for German Social Media and Web Texts	May 1, 2018	Domain AdaptationLemmatization	CodeCode Available
English-Basque Statistical and Neural Machine Translation	May 1, 2018	Machine TranslationNamed Entity Recognition (NER)	—Unverified
Multi-Dialect Arabic POS Tagging: A CRF Approach	May 1, 2018	Machine TranslationPart-Of-Speech Tagging	—Unverified
An Initial Test Collection for Ranked Retrieval of SMS Conversations	May 1, 2018	Information RetrievalMachine Translation	—Unverified

Show:10 25 50

← PrevPage 130 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified