Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10650 of 10752 papers

Title	Date	Tasks	Status
Integrating NLP Tools in a Distributed Environment: A Case Study Chaining a Tagger with a Dependency Parser	May 1, 2012	Machine TranslationPOS	—Unverified
Joint Segmentation and POS Tagging for Arabic Using a CRF-based Classifier	May 1, 2012	ArticlesBIG-bench Machine Learning	—Unverified
Evaluation of Classification Algorithms and Features for Collocation Extraction in Croatian	May 1, 2012	General ClassificationKeyword Extraction	—Unverified
A Study of Word-Classing for MT Reordering	May 1, 2012	Dependency ParsingLanguage Modelling	—Unverified
Expanding Parallel Resources for Medium-Density Languages for Free	May 1, 2012	Machine TranslationMorphological Analysis	—Unverified
Experiences in Resource Generation for Machine Translation through Crowdsourcing	May 1, 2012	Machine TranslationTranslation	—Unverified
Measuring the Divergence of Dependency Structures Cross-Linguistically to Improve Syntactic Projection Algorithms	May 1, 2012	Machine TranslationTranslation	—Unverified
Rich Morphology Generation Using Statistical Machine Translation	May 1, 2012	Language ModellingMachine Translation	—Unverified
Tajik-Farsi Persian Transliteration Using Statistical Machine Translation	May 1, 2012	Machine TranslationTranslation	—Unverified
Measuring Interlanguage: Native Language Identification with L1-influence Metrics	May 1, 2012	Language AcquisitionLanguage Identification	—Unverified
Annotated Corpora for Word Alignment between Japanese and English and its Evaluation with MAP-based Word Aligner	May 1, 2012	Machine TranslationSentence	—Unverified
Assessing the Comparability of News Texts	May 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Assessing Divergence Measures for Automated Document Routing in an Adaptive MT System	May 1, 2012	Document ClassificationMachine Translation	—Unverified
Extracting Directional and Comparable Corpora from a Multilingual Corpus for Translation Studies	May 1, 2012	Machine TranslationTranslation	—Unverified
Eye Tracking as a Tool for Machine Translation Error Analysis	May 1, 2012	Machine TranslationReading Comprehension	—Unverified
Romanian TimeBank: An Annotated Parallel Corpus for Temporal Information	May 1, 2012	Information RetrievalMachine Translation	—Unverified
RWTH-PHOENIX-Weather: A Large Vocabulary Sign Language Recognition and Translation Corpus	May 1, 2012	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An English-Portuguese parallel corpus of questions: translation guidelines and application in SMT	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Shared Task Proposal: Syntactic Paraphrase Ranking	May 1, 2012	Machine TranslationText Generation	—Unverified
Acquisition of Syntactic Simplification Rules for French	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Service Composition Scenarios for Task-Oriented Translation	May 1, 2012	Domain AdaptationLanguage Modelling	—Unverified
Identifying bilingual Multi-Word Expressions for Statistical Machine Translation	May 1, 2012	Machine TranslationTranslation	—Unverified
The FLaReNet Strategic Language Resource Agenda	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Linguistic Analysis Processing Line for Bulgarian	May 1, 2012	Language ModellingLemmatization	—Unverified
Same domain different discourse style - A case study on Language Resources for data-driven Machine Translation	May 1, 2012	Information RetrievalMachine Translation	—Unverified
A Rough Set Formalization of Quantitative Evaluation with Ambiguity	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Linguagrid: a network of Linguistic and Semantic Services for the Italian Language.	May 1, 2012	ClusteringDependency Parsing	—Unverified
A contrastive review of paraphrase acquisition techniques	May 1, 2012	ArticlesInformation Retrieval	—Unverified
A Richly Annotated, Multilingual Parallel Corpus for Hybrid Machine Translation	May 1, 2012	Machine TranslationTranslation	—Unverified
Light Verb Constructions in the SzegedParalellFX English--Hungarian Parallel Corpus	May 1, 2012	Machine TranslationRetrieval	—Unverified
Terra: a Collection of Translation Error-Annotated Corpora	May 1, 2012	Machine TranslationTranslation	—Unverified
Le Petit Prince in UNL	May 1, 2012	Information RetrievalMachine Translation	—Unverified
A Repository of Data and Evaluation Resources for Natural Language Generation	May 1, 2012	Data-to-Text GenerationMachine Translation	—Unverified
Annotating dropped pronouns in Chinese newswire text	May 1, 2012	Machine TranslationTranslation	—Unverified
A new semantically annotated corpus with syntactic-semantic and cross-lingual senses	May 1, 2012	Machine TranslationTranslation	—Unverified
Text Simplification Tools for Spanish	May 1, 2012	Machine TranslationText Simplification	—Unverified
Arabic-Segmentation Combination Strategies for Statistical Machine Translation	May 1, 2012	Machine TranslationSegmentation	—Unverified
An implementation of a Latvian resource grammar in Grammatical Framework	May 1, 2012	Machine TranslationSemantic Parsing	—Unverified
Holaaa!! writin like u talk is kewl but kinda hard 4 NLP	May 1, 2012	Domain AdaptationLanguage Modelling	—Unverified
Semi-Automatic Sign Language Corpora Annotation using Lexical Representations of Signs	May 1, 2012	Hand SegmentationMachine Translation	—Unverified
LDC Language Resource Database: Building a Bibliographic Database	May 1, 2012	Information RetrievalMachine Translation	—Unverified
HunOr: A Hungarian---Russian Parallel Corpus	May 1, 2012	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
Latvian and Lithuanian Named Entity Recognition with TildeNER	May 1, 2012	Machine Translationnamed-entity-recognition	—Unverified
A light way to collect comparable corpora from the Web	May 1, 2012	Information RetrievalMachine Translation	—Unverified
BUCEADOR, a multi-language search engine for digital libraries	May 1, 2012	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Buildind a Resource of Patterns Using Semantic Types	May 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Building a 70 billion word corpus of English from ClueWeb	May 1, 2012	Machine TranslationManagement	—Unverified
Can Statistical Post-Editing with a Small Parallel Corpus Save a Weak MT Engine?	May 1, 2012	Machine Translation	—Unverified
PEXACC: A Parallel Sentence Mining Algorithm from Comparable Corpora	May 1, 2012	Information RetrievalMachine Translation	—Unverified
PET: a Tool for Post-editing and Assessing Machine Translation	May 1, 2012	Machine TranslationSentence	—Unverified

Show:10 25 50

← PrevPage 213 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified