Transliteration

Transliteration is a mechanism for converting a word in a source (foreign) language to a target language, and often adopts approaches from machine translation. In machine translation, the objective is to preserve the semantic meaning of the utterance as much as possible while following the syntactic structure in the target language. In Transliteration, the objective is to preserve the original pronunciation of the source word as much as possible while following the phonological structures of the target language.

For example, the city’s name “Manchester” has become well known by people of languages other than English. These new words are often named entities that are important in cross-lingual information retrieval, information extraction, machine translation, and often present out-of-vocabulary challenges to spoken language technologies such as automatic speech recognition, spoken keyword search, and text-to-speech.

Source: Phonology-Augmented Statistical Framework for Machine Transliteration using Limited Linguistic Resources

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 435 papers

Title	Date	Tasks	Status
Transliteration of Judeo-Arabic Texts into Arabic Script Using Recurrent Neural Networks	Apr 23, 2020	Transliteration	—Unverified
Language-agnostic Multilingual Modeling	Apr 20, 2020	speech-recognitionSpeech Recognition	—Unverified
Machine Translation Pre-training for Data-to-Text Generation -- A Case Study in Czech	Apr 5, 2020	Data-to-Text GenerationMachine Translation	—Unverified
Urdu-English Machine Transliteration using Neural Networks	Jan 12, 2020	Machine TranslationSentence	—Unverified
A Multi-cascaded Deep Model for Bilingual SMS Classification	Nov 29, 2019	ClassificationGeneral Classification	CodeCode Available
Sideways Transliteration: How to Transliterate Multicultural Person Names?	Nov 27, 2019	Transliteration	—Unverified
Code-Mixed to Monolingual Translation Framework	Nov 9, 2019	Language ModelingLanguage Modelling	—Unverified
Rule based Approach for Word Normalization by resolving Transcription Ambiguity in Transliterated Search Queries	Oct 16, 2019	Information RetrievalRetrieval	—Unverified
Algorithms for certain classes of Tamil Spelling correction	Sep 22, 2019	Spelling CorrectionTransliteration	—Unverified
A systematic comparison of methods for low-resource dependency parsing on genuinely low-resource languages	Sep 6, 2019	Data AugmentationDependency Parsing	—Unverified
Latin script keyboards for South Asian languages with finite-state normalization	Sep 1, 2019	Transliteration	—Unverified
ANETAC: Arabic Named Entity Transliteration and Classification Dataset	Jul 6, 2019	ClassificationGeneral Classification	—Unverified
Joint Approach to Deromanization of Code-mixed Texts	Jun 1, 2019	Language IdentificationTransliteration	—Unverified
Event detection in Twitter: A keyword volume approach	Jan 3, 2019	Binary ClassificationEvent Detection	CodeCode Available
Improving the neural network-based machine transliteration for low-resourced language pair	Dec 1, 2018	Transliteration	—Unverified
A Rule-based Kurdish Text Transliteration System	Nov 26, 2018	Transliteration	CodeCode Available
Normalization of Transliterated Words in Code-Mixed Data Using Seq2Seq Model \& Levenshtein Distance	Nov 1, 2018	Opinion MiningTransliteration	—Unverified
Composing RNNs and FSTs for Small Data: Recovering Missing Characters in Old Hawaiian Text	Oct 15, 2018	Deep LearningReading Comprehension	—Unverified
Phonology-Augmented Statistical Framework for Machine Transliteration using Limited Linguistic Resources	Oct 7, 2018	Transliteration	—Unverified
Tilde's Parallel Corpus Filtering Methods for WMT 2018	Oct 1, 2018	Machine TranslationTranslation	—Unverified
A Comparison of Entity Matching Methods between English and Japanese Katakana	Oct 1, 2018	Transliteration	—Unverified
Arabizi sentiment analysis based on transliteration and automatic corpus annotation	Oct 1, 2018	Opinion MiningSentiment Analysis	—Unverified
The SLT-Interactions Parsing System at the CoNLL 2018 Shared Task	Oct 1, 2018	ARCDependency Parsing	—Unverified
Part-of-Speech Tagging for Code-Switched, Transliterated Texts without Explicit Language Identification	Oct 1, 2018	Language IdentificationPart-Of-Speech Tagging	—Unverified
Recovering Missing Characters in Old Hawaiian Writing	Oct 1, 2018	Language ModelingLanguage Modelling	—Unverified
Efficient Sequence Labeling with Actor-Critic Training	Sep 30, 2018	Decision MakingNER	CodeCode Available
Bootstrapping Transliteration with Constrained Discovery for Low-Resource Languages	Sep 20, 2018	Entity LinkingTransliteration	CodeCode Available
SentiALG: Automated Corpus Annotation for Algerian Sentiment Analysis	Aug 15, 2018	Sentiment AnalysisTransliteration	—Unverified
Hybrid approach for transliteration of Algerian arabizi: a primary study	Aug 10, 2018	Transliteration	—Unverified
Design Challenges in Named Entity Transliteration	Aug 7, 2018	DecoderTransliteration	CodeCode Available
Indigenous language technologies in Canada: Assessment, challenges, and successes	Aug 1, 2018	Machine TranslationOptical Character Recognition	—Unverified
Identifying Aggression and Toxicity in Comments using Capsule Network	Aug 1, 2018	Data AugmentationTransliteration	—Unverified
Transliteration Better than Translation? Answering Code-mixed Questions over a Knowledge Base	Jul 1, 2018	Automatic Speech Recognition (ASR)Information Retrieval	—Unverified
Low-Resource Machine Transliteration Using Recurrent Neural Networks of Asian Languages	Jul 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NEWS 2018 Whitepaper	Jul 1, 2018	BenchmarkingMachine Translation	—Unverified
Comparison of Assorted Models for Transliteration	Jul 1, 2018	Transliteration	—Unverified
A Deep Learning Based Approach to Transliteration	Jul 1, 2018	Deep LearningInformation Retrieval	—Unverified
Report of NEWS 2018 Named Entity Transliteration Shared Task	Jul 1, 2018	Information RetrievalMachine Translation	—Unverified
Statistical Machine Transliteration Baselines for NEWS 2018	Jul 1, 2018	Information RetrievalMachine Translation	—Unverified
Simple Features for Strong Performance on Named Entity Recognition in Code-Switched Twitter Data	Jul 1, 2018	Language Identificationnamed-entity-recognition	—Unverified
Neural Machine Translation Techniques for Named Entity Transliteration	Jul 1, 2018	Automatic Post-EditingDecoder	CodeCode Available
Addressing Noise in Multidialectal Word Embeddings	Jul 1, 2018	SentenceTransliteration	—Unverified
Gender Prediction in English-Hindi Code-Mixed Social Media Content : Corpus and Baseline System	Jun 14, 2018	Author ProfilingGender Prediction	—Unverified
Meaningless yet meaningful: Morphology grounded subword-level NMT	Jun 1, 2018	Machine TranslationNMT	—Unverified
Normalization of Transliterated Words in Code-Mixed Data Using Seq2Seq Model & Levenshtein Distance	May 22, 2018	Transliteration	—Unverified
Approche Hybride pour la translit\'eration de l'Arabizi Alg\'erien : une \'etude pr\'eliminaire (A hybrid approach for the transliteration of Algerian Arabizi: A primary study)	May 1, 2018	Transliteration	—Unverified
Unified Guidelines and Resources for Arabic Dialect Orthography	May 1, 2018	Machine TranslationSpeech Recognition	—Unverified
Creating Large-Scale Multilingual Cognate Tables	May 1, 2018	Machine TranslationSemantic Textual Similarity	CodeCode Available
A Bird's-eye View of Language Processing Projects at the Romanian Academy	May 1, 2018	Autonomous VehiclesKeyword Spotting	—Unverified
Portable Spelling Corrector for a Less-Resourced Language: Amharic	May 1, 2018	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 4 of 9Next →

No leaderboard results yet.