SOTAVerified|Agents Browse Leaderboard About Blog

Lemmatization

Lemmatization is a process of determining a base or dictionary form (lemma) for a given surface form. Especially for languages with rich morphology it is important to be able to normalize words into their base forms to better support for example search engines and linguistic studies. Main difficulties in Lemmatization arise from encountering previously unseen words during inference time as well as disambiguating ambiguous surface forms which can be inflected variants of several different base forms depending on the context.

Source: Universal Lemmatizer: A Sequence to Sequence Model for Lemmatizing Universal Dependencies Treebanks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 351 papers

Title	Date	Tasks	Status
Acquisition of semantic relations between terms: how far can we get with standard NLP tools?	Dec 1, 2016	Coreference ResolutionLemmatization	—Unverified
A Case Study of Spanish Text Transformations for Twitter Sentiment Analysis	Jun 3, 2021	LemmatizationOpinion Mining	—Unverified
A unified lexical processing framework based on the Margin Infused Relaxed Algorithm. A case study on the Romanian Language	Sep 1, 2013	LemmatizationSpeech Synthesis	—Unverified
An annotated English child language database	Apr 1, 2012	Language AcquisitionLemmatization	—Unverified
Advancing Full-Text Search Lemmatization Techniques with Paradigm Retrieval from OpenCorpora	May 18, 2023	LEMMALemmatization	—Unverified
A Comparative Study of Hybrid Models in Health Misinformation Text Classification	Oct 8, 2024	LemmatizationMisinformation	—Unverified
Analyzing and Aligning German compound nouns	May 1, 2012	LemmatizationTranslation	—Unverified
An Analysis of Lemmatization on Topic Models of Morphologically Rich Language	Aug 13, 2016	ArticlesLemmatization	—Unverified
A data-driven approach to verbal multiword expression detection. PARSEME Shared Task system description paper	Apr 1, 2017	feature selectionLemmatization	—Unverified
ACE-2005-PT: Corpus for Event Extraction in Portuguese	Aug 29, 2024	Event ExtractionLemmatization	—Unverified

Show:10 25 50

← PrevPage 4 of 36Next →

No leaderboard results yet.