Transliteration

Transliteration is a mechanism for converting a word in a source (foreign) language to a target language, and often adopts approaches from machine translation. In machine translation, the objective is to preserve the semantic meaning of the utterance as much as possible while following the syntactic structure in the target language. In Transliteration, the objective is to preserve the original pronunciation of the source word as much as possible while following the phonological structures of the target language.

For example, the city’s name “Manchester” has become well known by people of languages other than English. These new words are often named entities that are important in cross-lingual information retrieval, information extraction, machine translation, and often present out-of-vocabulary challenges to spoken language technologies such as automatic speech recognition, spoken keyword search, and text-to-speech.

Source: Phonology-Augmented Statistical Framework for Machine Transliteration using Limited Linguistic Resources

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 435 papers

Title	Date	Tasks	Status
Transliteration of Arabizi into Arabic Orthography: Developing a Parallel Annotated Arabizi-Arabic Script SMS/Chat Corpus	Oct 1, 2014	Transliteration	—Unverified
Transliteration of Foreign Words in Burmese	Oct 7, 2021	Transliteration	—Unverified
Transliteration of Judeo-Arabic Texts into Arabic Script Using Recurrent Neural Networks	Apr 23, 2020	Transliteration	—Unverified
Transliteration Systems across Indian Languages Using Parallel Corpora	Nov 1, 2013	Transliteration	—Unverified
UMUTeam@LT-EDI-ACL2022: Detecting homophobic and transphobic comments in Tamil	May 1, 2022	SentenceSentence Embeddings	—Unverified
Unified Guidelines and Resources for Arabic Dialect Orthography	May 1, 2018	Machine TranslationSpeech Recognition	—Unverified
UniGlyph: A Seven-Segment Script for Universal Language Representation	Oct 11, 2024	Diversityspeech-recognition	—Unverified
Unsupervised Language agnostic WER Standardization	Mar 9, 2023	speech-recognitionSpeech Recognition	—Unverified
Urdu-English Machine Transliteration using Neural Networks	Jan 12, 2020	Machine TranslationSentence	—Unverified
Urdu Hindi Machine Transliteration using SMT	Oct 1, 2013	Machine TranslationTransliteration	—Unverified
Urdu - Roman Transliteration via Finite State Transducers	Jul 1, 2012	Transliteration	—Unverified
Use of Transformer-Based Models for Word-Level Transliteration of the Book of the Dean of Lismore	May 23, 2022	Transliteration	—Unverified
Using Transliteration of Proper Names from Arabic to Latin Script to Improve English-Arabic Word Alignment	Oct 1, 2013	Information RetrievalMachine Translation	—Unverified
Utilisation de la translitt\'eration arabe pour l'am\'elioration de l'alignement de mots \`a partir de corpus parall\`eles fran -arabe (Using Arabic Transliteration to Improve Word Alignment from French-Arabic Parallel Corpora) [in French]	Jun 1, 2012	Information RetrievalMachine Translation	—Unverified
Uzbek Cyrillic-Latin-Cyrillic Machine Transliteration	Jan 13, 2021	Transliteration	—Unverified
Vocabulary-Based Language Similarity using Web Corpora	May 1, 2014	Language IdentificationTransliteration	—Unverified
Web-sentiment analysis of public comments (public reviews) for languages with limited resources such as the Kazakh language	Sep 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
Weighting Finite-State Transductions With Neural Context	Jun 1, 2016	LemmatizationStructured Prediction	—Unverified
What Matters Most in Morphologically Segmented SMT Models?	Jun 1, 2015	Machine TranslationTransliteration	—Unverified
When LLMs Struggle: Reference-less Translation Evaluation for Low-resource Languages	Jan 8, 2025	Machine TranslationTransliteration	—Unverified
When Transliteration Met Crowdsourcing : An Empirical Study of Transliteration via Crowdsourcing using Efficient, Non-redundant and Fair Quality Control	May 1, 2014	FairnessTransliteration	—Unverified
Whitepaper of NEWS 2012 Shared Task on Machine Transliteration	Jul 1, 2012	Machine TranslationTransliteration	—Unverified
Whitepaper of NEWS 2015 Shared Task on Machine Transliteration	Jul 1, 2015	Machine TranslationTransliteration	—Unverified
Whitepaper of NEWS 2016 Shared Task on Machine Transliteration	Aug 1, 2016	Machine TranslationTransliteration	—Unverified
Whose Nickname is This? Recognizing Politicians from Their Aliases	Dec 1, 2016	Entity LinkingNamed Entity Recognition (NER)	—Unverified
Word-level Language Identification in Bi-lingual Code-switched Texts	Dec 1, 2014	Language IdentificationOpinion Mining	—Unverified
Words.hk: A Comprehensive Cantonese Dictionary Dataset with Definitions, Translations and Transliterated Examples	Jun 1, 2022	SegmentationTransliteration	—Unverified
YAMAMA: Yet Another Multi-Dialect Arabic Morphological Analyzer	Dec 1, 2016	LemmatizationMorphological Analysis	—Unverified
Yandex School of Data Analysis Machine Translation Systems for WMT13	Aug 1, 2013	Machine TranslationSpelling Correction	—Unverified
Yandex School of Data Analysis Russian-English Machine Translation System for WMT14	Jun 1, 2014	Language ModellingMachine Translation	—Unverified
Algorithms for certain classes of Tamil Spelling correction	Sep 22, 2019	Spelling CorrectionTransliteration	—Unverified
``ye word kis lang ka hai bhai?'' Testing the Limits of Word level Language Identification	Dec 1, 2014	Language IdentificationTransliteration	—Unverified
3arif: A Corpus of Modern Standard and Egyptian Arabic Tweets Annotated for Epistemic Modality Using Interactive Crowdsourcing	Aug 1, 2014	Opinion MiningSentiment Analysis	—Unverified
A Bird's-eye View of Language Processing Projects at the Romanian Academy	May 1, 2018	Autonomous VehiclesKeyword Spotting	—Unverified
Accurate Word Segmentation using Transliteration and Language Model Projection	Aug 1, 2013	Language ModelingLanguage Modelling	—Unverified
A Classical Chinese Corpus with Nested Part-of-Speech Tags	Apr 1, 2012	Part-Of-Speech TaggingTransliteration	—Unverified
A Comparative Study of Extremely Low-Resource Transliteration of the World's Languages	May 1, 2018	Machine TranslationSpeech Recognition	—Unverified
A Comparison of Entity Matching Methods between English and Japanese Katakana	Oct 1, 2018	Transliteration	—Unverified
A complete character recognition and transliteration technique for Devanagari script	Sep 28, 2020	SegmentationTransliteration	—Unverified
A Conventional Orthography for Tunisian Arabic	May 1, 2014	Language ModellingMachine Translation	—Unverified
A Correlational Encoder Decoder Architecture for Pivot Based Sequence Generation	Jun 15, 2016	DecoderMachine Translation	—Unverified
Addressing Noise in Multidialectal Word Embeddings	Jul 1, 2018	SentenceTransliteration	—Unverified
A Deep Learning Based Approach to Transliteration	Jul 1, 2018	Deep LearningInformation Retrieval	—Unverified
A Digital Swedish-Yiddish/Yiddish-Swedish Dictionary: A Web-Based Dictionary that is also Available Offline	Jun 1, 2022	Transliteration	—Unverified
A Framework for the Classification and Annotation of Multiword Expressions in Dialectal Arabic	Oct 1, 2014	Entity Extraction using GANGeneral Classification	—Unverified
Agreement on Target-bidirectional Neural Machine Translation	Jun 1, 2016	Machine TranslationStructured Prediction	—Unverified
A House United: Bridging the Script and Lexical Barrier between Hindi and Urdu	Dec 1, 2016	Dependency ParsingMachine Translation	—Unverified
A Hybrid Transliteration Model for Chinese/English Named Entities ---BJTU-NLP Report for the 5th Named Entities Workshop	Jul 1, 2015	Machine TranslationTransliteration	—Unverified
A Hybrid Word Alignment Model for Phrase-Based Statistical Machine Translation	Aug 1, 2013	Domain AdaptationMachine Translation	—Unverified
AIDA2: A Hybrid Approach for Token and Sentence Level Dialect Identification in Arabic	Jul 1, 2015	Dialect IdentificationMachine Translation	—Unverified

Show:10 25 50

← PrevPage 8 of 9Next →

No leaderboard results yet.