Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9401–9450 of 10752 papers

Title	Date	Tasks	Status
Not an Interlingua, But Close: Comparison of English AMRs to Chinese and Czech	May 1, 2014	Machine TranslationSemantic Parsing	—Unverified
Shata-Anuvadak: Tackling Multiway Translation of Indian Languages	May 1, 2014	Machine TranslationTranslation	—Unverified
Sharing resources between free/open-source rule-based machine translation systems: Grammatical Framework and Apertium	May 1, 2014	Machine TranslationTranslation	—Unverified
Projection-based Annotation of a Polish Dependency Treebank	May 1, 2014	ARCDependency Parsing	—Unverified
A Japanese Word Dependency Corpus	May 1, 2014	ArticlesDependency Parsing	—Unverified
Hindi to English Machine Translation: Using Effective Selection in Multi-Model SMT	May 1, 2014	Machine Translationregression	—Unverified
HindEnCorp - Hindi-English and Hindi-only Corpus for Machine Translation	May 1, 2014	Machine TranslationTranslation	—Unverified
Designing and Evaluating a Reliable Corpus of Web Genres via Crowd-Sourcing	May 1, 2014	Information RetrievalMachine Translation	—Unverified
A Large-Scale Evaluation of Pre-editing Strategies for Improving User-Generated Content Translation	May 1, 2014	Domain AdaptationMachine Translation	—Unverified
HFST-SweNER --- A New NER Resource for Swedish	May 1, 2014	Machine Translationnamed-entity-recognition	—Unverified
Sentence Rephrasing for Parsing Sentences with OOV Words	May 1, 2014	Dependency ParsingDomain Adaptation	—Unverified
Innovations in Parallel Corpus Search Tools	May 1, 2014	Machine TranslationSentence	—Unverified
Automatic Extraction of Synonyms for German Particle Verbs from Parallel Data with Distributional Similarity as a Re-Ranking Feature	May 1, 2014	Language ModelingLanguage Modelling	—Unverified
Crowdsourcing for Evaluating Machine Translation Quality	May 1, 2014	Machine TranslationSentence	—Unverified
Hashtag Occurrences, Layout and Translation: A Corpus-driven Analysis of Tweets Published by the Canadian Government	May 1, 2014	Information RetrievalMachine Translation	—Unverified
Cross-linguistic annotation of narrativity for English/French verb tense disambiguation	May 1, 2014	Machine TranslationTranslation	—Unverified
Collaboration in the Production of a Massively Multilingual Lexicon	May 1, 2014	Machine Translation	—Unverified
English-French Verb Phrase Alignment in Europarl for Tense Translation Modeling	May 1, 2014	Machine TranslationPOS	—Unverified
Quality Estimation for Synthetic Parallel Data Generation	May 1, 2014	Machine TranslationSentence	—Unverified
Guampa: a Toolkit for Collaborative Translation	May 1, 2014	ArticlesMachine Translation	—Unverified
Linguistic Evaluation of Support Verb Constructions by OpenLogos and Google Translate	May 1, 2014	Machine TranslationTranslation	—Unverified
Linking Pictographs to Synsets: Sclera2Cornetto	May 1, 2014	Machine TranslationTranslation	—Unverified
Collocation or Free Combination? --- Applying Machine Translation Techniques to identify collocations in Japanese	May 1, 2014	Machine TranslationTranslation	—Unverified
Semantic Clustering of Pivot Paraphrases	May 1, 2014	ClusteringMachine Translation	—Unverified
Automatic Annotation of Machine Translation Datasets with Binary Quality Judgements	May 1, 2014	Machine TranslationRe-Ranking	—Unverified
Adapting VerbNet to French using existing resources	May 1, 2014	Machine TranslationSemantic Role Labeling	—Unverified
Billions of Parallel Words for Free: Building and Using the EU Bookshop Corpus	May 1, 2014	Machine TranslationTranslation	—Unverified
Building a Dataset of Multilingual Cognates for the Romanian Lexicon	May 1, 2014	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
Cross-Language Authorship Attribution	May 1, 2014	Authorship AttributionInformation Retrieval	—Unverified
All Fragments Count in Parser Evaluation	May 1, 2014	AllHuman Parsing	—Unverified
Multiword Expressions in Machine Translation	May 1, 2014	Language ModellingMachine Translation	—Unverified
Euronews: a multilingual speech corpus for ASR	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Machine Translation for Subtitling: A Large-Scale Evaluation	May 1, 2014	Language ModellingMachine Translation	—Unverified
Evaluating the effects of interactivity in a post-editing workbench	May 1, 2014	Machine Translation	—Unverified
Machine Translationness: Machine-likeness in Machine Translation Evaluation	May 1, 2014	Machine TranslationTranslation	—Unverified
Creating a massively parallel Bible corpus	May 1, 2014	Machine TranslationTranslation	—Unverified
Comparing two acquisition systems for automatically building an English---Croatian parallel corpus from multilingual websites	May 1, 2014	Information RetrievalMachine Translation	—Unverified
MADAMIRA: A Fast, Comprehensive Tool for Morphological Analysis and Disambiguation of Arabic	May 1, 2014	ChunkingLemmatization	—Unverified
An efficient language independent toolkit for complete morphological disambiguation	May 1, 2014	Language ModellingLemmatization	—Unverified
Adapting a part-of-speech tagset to non-standard text: The case of STTS	May 1, 2014	Domain AdaptationMachine Translation	—Unverified
Compounds and distributional thesauri	May 1, 2014	LemmatizationMachine Translation	—Unverified
Comprehensive Annotation of Multiword Expressions in a Social Web Corpus	May 1, 2014	DiversityLanguage Acquisition	—Unverified
Manual Analysis of Structurally Informed Reordering in German-English Machine Translation	May 1, 2014	Machine TranslationSentence	—Unverified
Mapping CPA Patterns onto OntoNotes Senses	May 1, 2014	Machine TranslationSentence	—Unverified
First approach toward Semantic Role Labeling for Basque	May 1, 2014	feature selectionMachine Translation	—Unverified
ParCor 1.0: A Parallel Pronoun-Coreference Corpus to Support Statistical MT	May 1, 2014	Machine TranslationTranslation	—Unverified
Rule-based Reordering Space in Statistical Machine Translation	May 1, 2014	Machine TranslationTranslation	—Unverified
MTWatch: A Tool for the Analysis of Noisy Parallel Data	May 1, 2014	ClassificationGeneral Classification	—Unverified
A Multidialectal Parallel Corpus of Arabic	May 1, 2014	Dialect IdentificationMachine Translation	—Unverified
Conceptual transfer: Using local classifiers for transfer selection	May 1, 2014	Machine TranslationTranslation	—Unverified

Show:10 25 50

← PrevPage 189 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified