Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10650 of 10752 papers

Title	Date	Tasks	Status
Two Phase Evaluation for Selecting Machine Translation Services	May 1, 2012	Machine TranslationTranslation	—Unverified
The FLaReNet Strategic Language Resource Agenda	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Text Simplification Tools for Spanish	May 1, 2012	Machine TranslationText Simplification	—Unverified
Turkish Paraphrase Corpus	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Using Noun Similarity to Adapt an Acceptability Measure for Persian Light Verb Constructions	May 1, 2012	Machine Translation	—Unverified
The META-SHARE Language Resources Sharing Infrastructure: Principles, Challenges, Solutions	May 1, 2012	Machine TranslationSpeech Recognition	—Unverified
The META-SHARE Metadata Schema for the Description of Language Resources	May 1, 2012	Machine TranslationRetrieval	—Unverified
Tajik-Farsi Persian Transliteration Using Statistical Machine Translation	May 1, 2012	Machine TranslationTranslation	—Unverified
Tools for plWordNet Development. Presentation and Perspectives	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
The ML4HMT Workshop on Optimising the Division of Labour in Hybrid Machine Translation	May 1, 2012	Language ModellingMachine Translation	—Unverified
Word Alignment for English-Turkish Language Pair	May 1, 2012	Machine TranslationTranslation	—Unverified
SUMAT: Data Collection and Parallel Corpus Compilation for Machine Translation of Subtitles	May 1, 2012	Machine TranslationTranslation	—Unverified
Using Wikipedia to Validate the Terminology found in a Corpus of Basic Textbooks	May 1, 2012	Machine TranslationTranslation	—Unverified
Two Database Resources for Processing Social Media English Text	May 1, 2012	Information RetrievalMachine Translation	—Unverified
The FAUST Corpus of Adequacy Assessments for Real-World Machine Translation Output	May 1, 2012	Machine TranslationTranslation	—Unverified
The Parallel-TUT: a multilingual and multiformat treebank	May 1, 2012	Machine Translation	—Unverified
The Joy of Parallelism with CzEng 1.0	May 1, 2012	Machine TranslationSentence	—Unverified
Towards a User-Friendly Platform for Building Language Resources based on Web Services	May 1, 2012	Machine TranslationTranslation	—Unverified
Suffix Trees as Language Models	May 1, 2012	Information RetrievalLanguage Modeling	—Unverified
The IMAGACT Cross-linguistic Ontology of Action. A new infrastructure for natural language disambiguation	May 1, 2012	Machine Translation	—Unverified
Turk Bootstrap Word Sense Inventory 2.0: A Large-Scale Resource for Lexical Substitution	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Terra: a Collection of Translation Error-Annotated Corpora	May 1, 2012	Machine TranslationTranslation	—Unverified
TimeBankPT: A TimeML Annotated Corpus of Portuguese	May 1, 2012	Machine TranslationTemporal Information Extraction	—Unverified
Translog-II: a Program for Recording User Activity Data for Empirical Reading and Writing Research	May 1, 2012	Data VisualizationMachine Translation	—Unverified
The Language Library: supporting community effort for collective resource production	May 1, 2012	Machine Translation	—Unverified
Using semi-experts to derive judgments on word sense alignment: a pilot study	May 1, 2012	Machine TranslationWord Sense Disambiguation	—Unverified
Holaaa!! writin like u talk is kewl but kinda hard 4 NLP	May 1, 2012	Domain AdaptationLanguage Modelling	—Unverified
Large Scale Lexical Analysis	May 1, 2012	Language IdentificationLexical Analysis	—Unverified
DSim, a Danish Parallel Corpus for Text Simplification	May 1, 2012	ArticlesMachine Translation	—Unverified
Constructing Large Proposition Databases	May 1, 2012	Dependency ParsingMachine Translation	—Unverified
Automatic lexical semantic classification of nouns	May 1, 2012	ClassificationEntity Typing	—Unverified
Extracting Directional and Comparable Corpora from a Multilingual Corpus for Translation Studies	May 1, 2012	Machine TranslationTranslation	—Unverified
Annotating dropped pronouns in Chinese newswire text	May 1, 2012	Machine TranslationTranslation	—Unverified
A Richly Annotated, Multilingual Parallel Corpus for Hybrid Machine Translation	May 1, 2012	Machine TranslationTranslation	—Unverified
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Evaluating Appropriateness Of System Responses In A Spoken CALL Game	May 1, 2012	Machine TranslationSpeech Recognition	—Unverified
An English-Portuguese parallel corpus of questions: translation guidelines and application in SMT	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
A tool for enhanced search of multilingual digital libraries of e-journals	May 1, 2012	ArticlesInformation Retrieval	—Unverified
DISLOG: A logic-based language for processing discourse structures	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Free/Open Source Shallow-Transfer Based Machine Translation for Spanish and Aragonese	May 1, 2012	Machine TranslationMorphological Analysis	—Unverified
Design and compilation of a specialized Spanish-German parallel corpus	May 1, 2012	Machine TranslationSentence	—Unverified
A High-Quality Web Corpus of Czech	May 1, 2012	ArticlesMachine Translation	—Unverified
A new semantically annotated corpus with syntactic-semantic and cross-lingual senses	May 1, 2012	Machine TranslationTranslation	—Unverified
Discourse-level Annotation over Europarl for Machine Translation: Connectives and Pronouns	May 1, 2012	Machine TranslationTranslation	—Unverified
Can Statistical Post-Editing with a Small Parallel Corpus Save a Weak MT Engine?	May 1, 2012	Machine Translation	—Unverified
Correlation between Similarity Measures for Inter-Language Linked Wikipedia Articles	May 1, 2012	ArticlesImage Captioning	—Unverified
Source-Language Dictionaries Help Non-Expert Users to Enlarge Target-Language Dictionaries for Machine Translation	May 1, 2012	Machine TranslationTranslation	—Unverified
Automatic MT Error Analysis: Hjerson Helping Addicter	May 1, 2012	General ClassificationMachine Translation	—Unverified
Experiences in Resource Generation for Machine Translation through Crowdsourcing	May 1, 2012	Machine TranslationTranslation	—Unverified
On Using Linked Data for Language Resource Sharing in the Long Tail of the Localisation Market	May 1, 2012	Machine TranslationTranslation	—Unverified

Show:10 25 50

← PrevPage 213 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified