Lemmatization

Lemmatization is a process of determining a base or dictionary form (lemma) for a given surface form. Especially for languages with rich morphology it is important to be able to normalize words into their base forms to better support for example search engines and linguistic studies. Main difficulties in Lemmatization arise from encountering previously unseen words during inference time as well as disambiguating ambiguous surface forms which can be inflected variants of several different base forms depending on the context.

Source: Universal Lemmatizer: A Sequence to Sequence Model for Lemmatizing Universal Dependencies Treebanks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 351 papers

Title	Date	Tasks	Status
A unified lexical processing framework based on the Margin Infused Relaxed Algorithm. A case study on the Romanian Language	Sep 1, 2013	LemmatizationSpeech Synthesis	—Unverified
Cross-Language Plagiarism Detection Methods	Sep 1, 2013	LemmatizationMachine Translation	—Unverified
Modernizing historical Slovene words with character-based SMT	Aug 1, 2013	LemmatizationMachine Translation	—Unverified
UZH in BioNLP 2013	Aug 1, 2013	ChunkingDependency Parsing	—Unverified
Lemmatization and Morphosyntactic Tagging of Croatian and Serbian	Aug 1, 2013	LemmatizationPart-Of-Speech Tagging	—Unverified
DKPro Similarity: An Open Source Framework for Text Similarity	Aug 1, 2013	LemmatizationSemantic Textual Similarity	—Unverified
Chimera -- Three Heads for English-to-Czech Translation	Aug 1, 2013	LemmatizationMachine Translation	—Unverified
Factored Machine Translation Systems for Russian-English	Aug 1, 2013	LemmatizationMachine Translation	—Unverified
An extended morphological analyzer of German handling verbal forms with separated separable particles (Un analyseur morphologique \'etendu de l'allemand traitant les formes verbales \`a particule s\'epar\'ee) [in French]	Jun 1, 2013	LemmatizationMorphological Analysis	—Unverified
Simultaneous Word-Morpheme Alignment for Statistical Machine Translation	Jun 1, 2013	LemmatizationMachine Translation	—Unverified
SSA-UO: Unsupervised Sentiment Analysis in Twitter	Jun 1, 2013	LemmatizationProduct Recommendation	—Unverified
NRC: A Machine Translation Approach to Cross-Lingual Word Sense Disambiguation (SemEval-2013 Task 10)	Jun 1, 2013	LemmatizationMachine Translation	—Unverified
Morphological Analysis and Disambiguation for Dialectal Arabic	Jun 1, 2013	LemmatizationMachine Translation	—Unverified
[LVIC-LIMSI]: Using Syntactic Features and Multi-polarity Words for Sentiment Analysis in Twitter	Jun 1, 2013	General ClassificationLemmatization	—Unverified
Towards an automatic identification of chiasmus of words (Vers une identification automatique du chiasme de mots) [in French]	Jun 1, 2013	Lemmatization	—Unverified
KLUE-CORE: A regression model of semantic textual similarity	Jun 1, 2013	LemmatizationQuestion Answering	—Unverified
CNGL-CORE: Referential Translation Machines for Measuring Semantic Similarity	Jun 1, 2013	LemmatizationMachine Translation	—Unverified
UBC\_UOS-TYPED: Regression for typed-similarity	Jun 1, 2013	LemmatizationNamed Entity Recognition (NER)	—Unverified
Development of a Hindi Lemmatizer	May 24, 2013	LemmatizationMachine Translation	CodeCode Available
The Floating Arabic Dictionary: An Automatic Method for Updating a Lexical Database through the Detection and Lemmatization of Unknown Words	Dec 1, 2012	Lemmatization	—Unverified
Lexical Categories for Improved Parsing of Web Data	Dec 1, 2012	Dependency ParsingLemmatization	—Unverified
Enhancing Lemmatization for Mongolian and its Application to Statistical Machine Translation	Dec 1, 2012	Information RetrievalLemmatization	—Unverified
Beyond Stemming and Lemmatization: Ultra-stemming to Improve Automatic Text Summarization	Sep 14, 2012	LemmatizationText Summarization	CodeCode Available
WSD for n-best reranking and local language modeling in SMT	Jul 1, 2012	Language ModelingLanguage Modelling	—Unverified
Statistical Parsing of Spanish and Data Driven Lemmatization	Jul 1, 2012	LemmatizationPart-Of-Speech Tagging	—Unverified

Show:10 25 50

← PrevPage 13 of 15Next →

No leaderboard results yet.