Machine Translation

Machine translation is the task of translating a sentence in a source language to a different target language.

Approaches for machine translation can range from rule-based to statistical to neural-based. More recently, encoder-decoder attention-based architectures like BERT have attained major improvements in machine translation.

One of the most popular datasets used to benchmark machine translation systems is the WMT family of datasets. Some of the most commonly used evaluation metrics for machine translation systems include BLEU, METEOR, NIST, and others.

( Image credit: Google seq2seq )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 10752 papers

Title	Date	Tasks	Status
Ukrainian-to-English folktale corpus: Parallel corpus creation and augmentation for machine translation in low-resource languages	Oct 14, 2024	Machine TranslationSentence	—Unverified
Machine Translation Evaluation Benchmark for Wu Chinese: Workflow and Analysis	Oct 14, 2024	Machine TranslationTranslation	—Unverified
Watching the Watchers: Exposing Gender Disparities in Machine Translation Quality Estimation	Oct 14, 2024	Machine TranslationTranslation	CodeCode Available
QE-EBM: Using Quality Estimators as Energy Loss for Machine Translation	Oct 14, 2024	Machine TranslationNMT	—Unverified
Effective Self-Mining of In-Context Examples for Unsupervised Machine Translation with LLMs	Oct 14, 2024	In-Context LearningMachine Translation	—Unverified
State of NLP in Kenya: A Survey	Oct 13, 2024	Information RetrievalMachine Translation	—Unverified
Adapters for Altering LLM Vocabularies: What Languages Benefit the Most?	Oct 12, 2024	Machine Translation	CodeCode Available
SLAM-AAC: Enhancing Audio Captioning with Paraphrasing Augmentation and CLAP-Refine through LLMs	Oct 12, 2024	AudioCapsAudio captioning	—Unverified
Balancing Innovation and Privacy: Data Security Strategies in Natural Language Processing Applications	Oct 11, 2024	Computational EfficiencyMachine Translation	—Unverified
NusaMT-7B: Machine Translation for Low-Resource Indonesian Languages with Large Language Models	Oct 10, 2024	Machine TranslationNMT	—Unverified
Modeling User Preferences with Automatic Metrics: Creating a High-Quality Preference Dataset for Machine Translation	Oct 10, 2024	Machine TranslationSentence	—Unverified
Personal Intelligence System UniLM: Hybrid On-Device Small Language Model and Server-Based Large Language Model for Malay Nusantara	Oct 9, 2024	Language ModelingLanguage Modelling	—Unverified
Mitigating the Language Mismatch and Repetition Issues in LLM-based Machine Translation via Model Editing	Oct 9, 2024	Machine TranslationModel Editing	CodeCode Available
Are Large Language Models State-of-the-art Quality Estimators for Machine Translation of User-generated Content?	Oct 8, 2024	In-Context LearningMachine Translation	CodeCode Available
Neural machine translation system for Lezgian, Russian and Azerbaijani languages	Oct 7, 2024	Language ModelingLanguage Modelling	CodeCode Available
Beyond Correlation: Interpretable Evaluation of Machine Translation Metrics	Oct 7, 2024	Machine TranslationRe-Ranking	—Unverified
Leveraging Grammar Induction for Language Understanding and Generation	Oct 7, 2024	Machine TranslationNatural Language Understanding	CodeCode Available
CTC-GMM: CTC guided modality matching for fast and accurate streaming speech translation	Oct 7, 2024	GPUMachine Translation	—Unverified
Translation Canvas: An Explainable Interface to Pinpoint and Analyze Translation Systems	Oct 7, 2024	BenchmarkingMachine Translation	—Unverified
A test suite of prompt injection attacks for LLM-based machine translation	Oct 7, 2024	Machine TranslationTranslation	CodeCode Available
On Instruction-Finetuning Neural Machine Translation Models	Oct 7, 2024	Domain AdaptationInstruction Following	—Unverified
Toxic Subword Pruning for Dialogue Response Generation on Large Language Models	Oct 5, 2024	Language ModellingMachine Translation	—Unverified
Can the Variation of Model Weights be used as a Criterion for Self-Paced Multilingual NMT?	Oct 5, 2024	Machine TranslationNMT	—Unverified
PsFuture: A Pseudo-Future-based Zero-Shot Adaptive Policy for Simultaneous Machine Translation	Oct 5, 2024	Machine TranslationTranslation	—Unverified
Textless Streaming Speech-to-Speech Translation using Semantic Speech Tokens	Oct 4, 2024	Language ModelingLanguage Modelling	—Unverified
What do Large Language Models Need for Machine Translation Evaluation?	Oct 4, 2024	Machine TranslationTranslation	CodeCode Available
X-ALMA: Plug & Play Modules and Adaptive Rejection for Quality Translation at Scale	Oct 4, 2024	Machine TranslationTranslation	—Unverified
A Multi-task Learning Framework for Evaluating Machine Translation of Emotion-loaded User-generated Content	Oct 4, 2024	Emotion ClassificationMachine Translation	—Unverified
Post-edits Are Preferences Too	Oct 3, 2024	Machine TranslationTranslation	—Unverified
Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning	Oct 3, 2024	BenchmarkingLanguage Modeling	—Unverified
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study	Oct 1, 2024	Machine TranslationTranslation	CodeCode Available
On the Implications of Verbose LLM Outputs: A Case Study in Translation Evaluation	Oct 1, 2024	Machine TranslationTranslation	—Unverified
Efficient Technical Term Translation: A Knowledge Distillation Approach for Parenthetical Terminology Translation	Oct 1, 2024	Knowledge DistillationMachine Translation	—Unverified
Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis	Sep 30, 2024	Machine TranslationTranslation	—Unverified
Evaluating and explaining training strategies for zero-shot cross-lingual news sentiment analysis	Sep 30, 2024	Cross-Lingual TransferIn-Context Learning	—Unverified
Contrastive Token Learning with Similarity Decay for Repetition Suppression in Machine Translation	Sep 30, 2024	HallucinationMachine Translation	—Unverified
Multimodal LLM Enhanced Cross-lingual Cross-modal Retrieval	Sep 30, 2024	Cross-Modal RetrievalLarge Language Model	CodeCode Available
Disentangling Singlish Discourse Particles with Task-Driven Representation	Sep 30, 2024	DisentanglementMachine Translation	—Unverified
LANDeRMT: Detecting and Routing Language-Aware Neurons for Selectively Finetuning LLMs to Machine Translation	Sep 29, 2024	Machine TranslationTranslation	—Unverified
Can LLMs Really Learn to Translate a Low-Resource Language from One Grammar Book?	Sep 27, 2024	Machine TranslationTranslation	—Unverified
Predicting Anchored Text from Translation Memories for Machine Translation Using Deep Learning Methods	Sep 26, 2024	Machine TranslationTranslation	—Unverified
On Translating Technical Terminology: A Translation Workflow for Machine-Translated Acronyms	Sep 26, 2024	fr-enMachine Translation	—Unverified
Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization	Sep 26, 2024	Machine TranslationNMT	—Unverified
Shifting from endangerment to rebirth in the Artificial Intelligence Age: An Ensemble Machine Learning Approach for Hawrami Text Classification	Sep 25, 2024	ArticlesClassification	CodeCode Available
On Extending Direct Preference Optimization to Accommodate Ties	Sep 25, 2024	Machine Translation	—Unverified
Multilingual Transfer and Domain Adaptation for Low-Resource Languages of Spain	Sep 24, 2024	DenoisingDomain Adaptation	—Unverified
Machine Translation Advancements of Low-Resource Indian Languages by Transfer Learning	Sep 24, 2024	Machine TranslationTransfer Learning	—Unverified
EuroLLM: Multilingual Language Models for Europe	Sep 24, 2024	Machine Translation	—Unverified
Real-Time Detection of Electronic Components in Waste Printed Circuit Boards: A Transformer-Based Approach	Sep 24, 2024	Machine Translationobject-detection	—Unverified
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks	Sep 23, 2024	Automatic Post-EditingEnsemble Learning	—Unverified

Show:10 25 50

← PrevPage 25 of 216Next →

All datasets WMT2014 English-German WMT2014 English-French IWSLT2014 German-English ACES WMT2016 English-Romanian WMT2016 Romanian-English WMT2014 German-English IWSLT2015 German-English WMT2016 English-German IWSLT2015 English-Vietnamese IWSLT2015 English-German WMT2016 German-English

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer Cycle (Rev)	BLEU score	35.14	—	Unverified
2	Noisy back-translation	BLEU score	35	—	Unverified
3	Transformer+Rep(Uni)	BLEU score	33.89	—	Unverified
4	T5-11B	BLEU score	32.1	—	Unverified
5	BiBERT	BLEU score	31.26	—	Unverified
6	Transformer + R-Drop	BLEU score	30.91	—	Unverified
7	Bi-SimCut	BLEU score	30.78	—	Unverified
8	BERT-fused NMT	BLEU score	30.75	—	Unverified
9	Data Diversification - Transformer	BLEU score	30.7	—	Unverified
10	SimCut	BLEU score	30.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer+BT (ADMIN init)	BLEU score	46.4	—	Unverified
2	Noisy back-translation	BLEU score	45.6	—	Unverified
3	mRASP+Fine-Tune	BLEU score	44.3	—	Unverified
4	Transformer + R-Drop	BLEU score	43.95	—	Unverified
5	Admin	BLEU score	43.8	—	Unverified
6	Transformer (ADMIN init)	BLEU score	43.8	—	Unverified
7	BERT-fused NMT	BLEU score	43.78	—	Unverified
8	MUSE(Paralllel Multi-scale Attention)	BLEU score	43.5	—	Unverified
9	T5	BLEU score	43.4	—	Unverified
10	Local Joint Self-attention	BLEU score	43.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PiNMT	BLEU score	40.43	—	Unverified
2	BiBERT	BLEU score	38.61	—	Unverified
3	Bi-SimCut	BLEU score	38.37	—	Unverified
4	Cutoff + Relaxed Attention + LM	BLEU score	37.96	—	Unverified
5	DRDA	BLEU score	37.95	—	Unverified
6	Transformer + R-Drop + Cutoff	BLEU score	37.9	—	Unverified
7	SimCut	BLEU score	37.81	—	Unverified
8	Cutoff+Knee	BLEU score	37.78	—	Unverified
9	Cutoff	BLEU score	37.6	—	Unverified
10	CipherDAug	BLEU score	37.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HWTSC-Teacher-Sim	Score	19.97	—	Unverified
2	MS-COMET-22	Score	19.89	—	Unverified
3	MS-COMET-QE-22	Score	19.76	—	Unverified
4	KG-BERTScore	Score	17.28	—	Unverified
5	metricx_xl_DA_2019	Score	17.17	—	Unverified
6	COMET-QE	Score	16.8	—	Unverified
7	COMET-22	Score	16.31	—	Unverified
8	UniTE-src	Score	15.68	—	Unverified
9	UniTE-ref	Score	15.38	—	Unverified
10	metricx_xxl_DA_2019	Score	15.24	—	Unverified