Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7301–7350 of 10752 papers

Title	Date	Tasks	Status
Simple Compound Splitting for German	Apr 1, 2017	Information RetrievalLEMMA	—Unverified
Factoring Ambiguity out of the Prediction of Compositionality for German Multi-Word Expressions	Apr 1, 2017	ClusteringMachine Translation	—Unverified
A Layered Language Model based Hybrid Approach to Automatic Full Diacritization of Arabic	Apr 1, 2017	Arabic Text DiacritizationForm	—Unverified
SHAKKIL: An Automatic Diacritization System for Modern Standard Arabic Texts	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
Arabic Textual Entailment with Word Embeddings	Apr 1, 2017	Machine TranslationNatural Language Inference	—Unverified
Arabic Dialect Identification Using iVectors and ASR Transcripts	Apr 1, 2017	Dialect IdentificationMachine Translation	—Unverified
Adapting a State-of-the-Art Tagger for South Slavic Languages to Non-Standard Text	Apr 1, 2017	Domain AdaptationLemmatization	—Unverified
Rule-Based Translation of Spanish Verb-Noun Combinations into Basque	Apr 1, 2017	Machine TranslationTranslation	—Unverified
Why Catalan-Spanish Neural Machine Translation? Analysis, comparison and combination with standard Rule and Phrase-based technologies	Apr 1, 2017	Machine TranslationTranslation	—Unverified
Universal Dependencies for Arabic	Apr 1, 2017	Machine TranslationQuestion Answering	—Unverified
A Preliminary Study of Croatian Lexical Substitution	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
Word Similarity Datasets for Indian Languages: Annotation and Baseline Systems	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
Semantic Similarity of Arabic Sentences with Word Embeddings	Apr 1, 2017	DescriptiveInformation Retrieval	—Unverified
Ethical Considerations in NLP Shared Tasks	Apr 1, 2017	EthicsMachine Translation	—Unverified
Neural Networks for Multi-Word Expression Detection	Apr 1, 2017	Machine Translation	—Unverified
Slavic Forest, Norwegian Wood	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
ParaDi: Dictionary of Paraphrases of Czech Complex Predicates with Light Verbs	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
Using bilingual word-embeddings for multilingual collocation extraction	Apr 1, 2017	Machine TranslationTranslation	—Unverified
Using Linked Disambiguated Distributional Networks for Word Sense Disambiguation	Apr 1, 2017	Machine TranslationTranslation	—Unverified
Discriminating between Similar Languages Using a Combination of Typed and Untyped Character N-grams and Words	Apr 1, 2017	General ClassificationInformation Retrieval	—Unverified
Discovering Light Verb Constructions and their Translations from Parallel Corpora without Word Alignment	Apr 1, 2017	Machine TranslationTranslation	—Unverified
A Neural Architecture for Dialectal Arabic Segmentation	Apr 1, 2017	Machine TranslationMorphological Analysis	—Unverified
Kurdish Interdialect Machine Translation	Apr 1, 2017	Machine TranslationTranslation	—Unverified
Using Coreference Links to Improve Spanish-to-English Machine Translation	Apr 1, 2017	Coreference ResolutionDecoder	CodeCode Available
Toward Pan-Slavic NLP: Some Experiments with Language Adaptation	Apr 1, 2017	Domain AdaptationLanguage Modeling	—Unverified
Automated WordNet Construction Using Word Embeddings	Apr 1, 2017	Information RetrievalMachine Translation	CodeCode Available
Cross-lingual dependency parsing for closely related languages - Helsinki's submission to VarDial 2017	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
Identifying Effective Translations for Cross-lingual Arabic-to-English User-generated Speech Search	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
Human Evaluation of Multi-modal Neural Machine Translation: A Case-Study on E-Commerce Listing Titles	Apr 1, 2017	Machine TranslationNMT	—Unverified
Parsing and MWE Detection: Fips at the PARSEME Shared Task	Apr 1, 2017	Lexical AnalysisMachine Translation	—Unverified
German Dialect Identification in Interview Transcriptions	Apr 1, 2017	Dialect IdentificationMachine Translation	—Unverified
Evaluating the Reliability and Interaction of Recursively Used Feature Classes for Terminology Extraction	Apr 1, 2017	BIG-bench Machine LearningClassification	—Unverified
The SUMMA Platform Prototype	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Building Web-Interfaces for Vector Semantic Models with the WebVectors Toolkit	Apr 1, 2017	Machine TranslationNamed Entity Recognition (NER)	—Unverified
QCRI Live Speech Translation System	Apr 1, 2017	Machine TranslationSpeech Recognition	—Unverified
Modelling metaphor with attribute-based semantics	Apr 1, 2017	AttributeMachine Translation	—Unverified
Machine Translation of Spanish Personal and Possessive Pronouns Using Anaphora Probabilities	Apr 1, 2017	Coreference ResolutionMachine Translation	CodeCode Available
Literal or idiomatic? Identifying the reading of single occurrences of German multiword expressions using word embeddings	Apr 1, 2017	Machine TranslationSemantic Similarity	—Unverified
Lexicalized Reordering for Left-to-Right Hierarchical Phrase-based Translation	Apr 1, 2017	Language ModelingLanguage Modelling	—Unverified
Using Images to Improve Machine-Translating E-Commerce Product Listings.	Apr 1, 2017	Machine TranslationNMT	—Unverified
Autobank: a semi-automatic annotation tool for developing deep Minimalist Grammar treebanks	Apr 1, 2017	Machine Translation	—Unverified
Co-reference Resolution of Elided Subjects and Possessive Pronouns in Spanish-English Statistical Machine Translation	Apr 1, 2017	Coreference ResolutionMachine Translation	—Unverified
Using Word Embedding for Cross-Language Plagiarism Detection	Apr 1, 2017	Machine TranslationSentence	—Unverified
Continuous multilinguality with language vectors	Apr 1, 2017	Image CaptioningLanguage Modeling	—Unverified
Alto: Rapid Prototyping for Parsing and Translation	Apr 1, 2017	Machine TranslationSemantic Parsing	—Unverified
Common Round: Application of Language Technologies to Large-Scale Web Debates	Apr 1, 2017	Decision MakingMachine Translation	—Unverified
A Rich Morphological Tagger for English: Exploring the Cross-Linguistic Tradeoff Between Morphology and Syntax	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
Online Automatic Post-editing for MT in a Multi-Domain Translation Environment	Apr 1, 2017	Automatic Post-EditingDecoder	—Unverified
Building Lexical Vector Representations from Concept Definitions	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
Neural vs. Phrase-Based Machine Translation in a Multi-Domain Scenario	Apr 1, 2017	Domain AdaptationMachine Translation	—Unverified

Show:10 25 50

← PrevPage 147 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
6	Admin	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified