Transliteration

Transliteration is a mechanism for converting a word in a source (foreign) language to a target language, and often adopts approaches from machine translation. In machine translation, the objective is to preserve the semantic meaning of the utterance as much as possible while following the syntactic structure in the target language. In Transliteration, the objective is to preserve the original pronunciation of the source word as much as possible while following the phonological structures of the target language.

For example, the city’s name “Manchester” has become well known by people of languages other than English. These new words are often named entities that are important in cross-lingual information retrieval, information extraction, machine translation, and often present out-of-vocabulary challenges to spoken language technologies such as automatic speech recognition, spoken keyword search, and text-to-speech.

Source: Phonology-Augmented Statistical Framework for Machine Transliteration using Limited Linguistic Resources

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 435 papers

Title	Date	Tasks	Status
Normalization of Transliterated Words in Code-Mixed Data Using Seq2Seq Model & Levenshtein Distance	May 22, 2018	Transliteration	—Unverified
Normalization of Transliterated Words in Code-Mixed Data Using Seq2Seq Model \& Levenshtein Distance	Nov 1, 2018	Opinion MiningTransliteration	—Unverified
NRC Russian-English Machine Translation System for WMT 2016	Aug 1, 2016	LemmatizationMachine Translation	—Unverified
NusaAksara: A Multimodal and Multilingual Benchmark for Preserving Indonesian Indigenous Scripts	Feb 25, 2025	Image SegmentationLanguage Identification	—Unverified
OFFLangOne@DravidianLangTech-EACL2021: Transformers with the Class Balanced Loss for Offensive Language Identification in Dravidian Code-Mixed text.	Apr 1, 2021	Language IdentificationTransliteration	—Unverified
Opinion Mining in a Code-Mixed Environment: A Case Study with Government Portals	Dec 1, 2016	Opinion MiningTransliteration	—Unverified
Optimizing Multilingual Text-To-Speech with Accents & Emotions	Jun 19, 2025	DisentanglementEmotion Recognition	—Unverified
Optimizing Transliteration for Hindi/Marathi to English Using only Two Weights	Dec 1, 2012	TransliterationVocal Bursts Valence Prediction	—Unverified
Orthographic and Morphological Processing for Persian-to-English Statistical Machine Translation	Oct 1, 2013	Machine TranslationTranslation	—Unverified
Palmyra: A Platform Independent Dependency Annotation Tool for Morphologically Rich Languages	May 1, 2018	Dependency ParsingTransliteration	—Unverified
Part-of-Speech Tagging for Code-Switched, Transliterated Texts without Explicit Language Identification	Oct 1, 2018	Language IdentificationPart-Of-Speech Tagging	—Unverified
Phonologically Aware Neural Model for Named Entity Recognition in Low Resource Transfer Settings	Nov 1, 2016	Cross-Lingual TransferFeature Engineering	—Unverified
Phonology-Augmented Statistical Framework for Machine Transliteration using Limited Linguistic Resources	Oct 7, 2018	Transliteration	—Unverified
PJAIT Systems for the IWSLT 2015 Evaluation Campaign Enhanced by Comparable Corpora	Dec 5, 2015	Domain AdaptationLanguage Modeling	—Unverified
PJAIT Systems for the WMT 2016	Aug 1, 2016	Domain AdaptationLanguage Modeling	—Unverified
PJIIT's systems for WMT 2017 Conference	Sep 1, 2017	Domain AdaptationLanguage Modeling	—Unverified
PolyIPA -- Multilingual Phoneme-to-Grapheme Conversion Model	Dec 12, 2024	Data AugmentationInformation Retrieval	—Unverified
Portable Spelling Corrector for a Less-Resourced Language: Amharic	May 1, 2018	Language ModelingLanguage Modelling	—Unverified
POS Tagging of English-Hindi Code-Mixed Social Media Content	Oct 1, 2014	Language IdentificationPOS	—Unverified
POS Tagging of Hindi-English Code Mixed Text from Social Media: Some Machine Learning Experiments	Dec 1, 2015	BIG-bench Machine LearningLanguage Identification	—Unverified
Processing Informal, Romanized Pakistani Text Messages	Jun 1, 2012	Machine TranslationTransliteration	—Unverified
Proper Name Diacritization for Arabic Wikipedia: A Benchmark Dataset	May 5, 2025	Transliteration	—Unverified
Proper Name Machine Translation from Japanese to Japanese Sign Language	Oct 1, 2014	Machine TranslationTranslation	—Unverified
Putting Figures on Influences on Moroccan Darija from Arabic, French and Spanish using the WordNet	Jan 1, 2018	TranslationTransliteration	—Unverified
QCRI-MES Submission at WMT13: Using Transliteration Mining to Improve Statistical Machine Translation	Aug 1, 2013	Machine TranslationTranslation	—Unverified
Query Translation for Cross-Language Information Retrieval using Multilingual Word Clusters	Dec 1, 2016	Community DetectionInformation Retrieval	—Unverified
Quillpad Multilingual Predictive Transliteration System	Dec 1, 2012	Transliteration	—Unverified
QuranTree.jl: A Julia Package for Quranic Arabic Corpus	Apr 1, 2021	Transliteration	—Unverified
Recovering Missing Characters in Old Hawaiian Writing	Oct 1, 2018	Language ModelingLanguage Modelling	—Unverified
Regularity and Flexibility in English-Chinese Name Transliteration	Jul 1, 2015	Transliteration	—Unverified
Regularized Interlingual Projections: Evaluation on Multilingual Transliteration	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified
Regulating Orthography-Phonology Relationship for English to Thai Transliteration	Aug 1, 2016	Machine TranslationTransliteration	—Unverified
Report of NEWS 2012 Machine Transliteration Shared Task	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified
Report of NEWS 2015 Machine Transliteration Shared Task	Jul 1, 2015	Information RetrievalMachine Translation	—Unverified
Report of NEWS 2016 Machine Transliteration Shared Task	Aug 1, 2016	Information RetrievalMachine Translation	—Unverified
Report of NEWS 2018 Named Entity Transliteration Shared Task	Jul 1, 2018	Information RetrievalMachine Translation	—Unverified
Rescoring a Phrase-based Machine Transliteration System with Recurrent Neural Network Language Models	Jul 1, 2012	Transliteration	—Unverified
Rethinking Hate Speech Detection on Social Media: Can LLMs Replace Traditional Models?	Jun 15, 2025	Hate Speech DetectionTransliteration	—Unverified
Review of Computational Epigraphy	Jun 3, 2024	AttributeTransliteration	—Unverified
Robust Dictionary Lookup in Multiple Noisy Orthographies	Apr 1, 2017	Transliteration	—Unverified
Robust Transliteration Mining from Comparable Corpora with Bilingual Topic Models	Oct 1, 2013	Machine TranslationTopic Models	—Unverified
Romanization-based Approach to Morphological Analysis in Korean SMS Text Processing	Oct 1, 2013	Morphological AnalysisOpinion Mining	—Unverified
Romanization-based Large-scale Adaptation of Multilingual Language Models	Apr 18, 2023	Cross-Lingual TransferTransliteration	—Unverified
Romanized Arabic Transliteration	Dec 1, 2012	Machine TranslationSpeech Recognition	—Unverified
Romanized Berber and Romanized Arabic Automatic Language Identification Using Machine Learning	Dec 1, 2016	BIG-bench Machine LearningLanguage Identification	—Unverified
Rule based Approach for Word Normalization by resolving Transcription Ambiguity in Transliterated Search Queries	Oct 16, 2019	Information RetrievalRetrieval	—Unverified
Rule Based Transliteration Scheme for English to Punjabi	Jul 15, 2013	Machine TranslationTranslation	—Unverified
Russian Stress Prediction using Maximum Entropy Ranking	Oct 1, 2013	Machine TranslationPrediction	—Unverified
Samsung R&D Institute Poland submission to WAT 2021 Indic Language Multilingual Task	Aug 1, 2021	Domain AdaptationKnowledge Distillation	—Unverified
Sangam: A Perso-Arabic to Indic Script Machine Transliteration Model	Dec 1, 2014	Transliteration	—Unverified

Show:10 25 50

← PrevPage 7 of 9Next →

No leaderboard results yet.