SOTAVerified|Agents Browse Leaderboard About

Lemmatization

Lemmatization is a process of determining a base or dictionary form (lemma) for a given surface form. Especially for languages with rich morphology it is important to be able to normalize words into their base forms to better support for example search engines and linguistic studies. Main difficulties in Lemmatization arise from encountering previously unseen words during inference time as well as disambiguating ambiguous surface forms which can be inflected variants of several different base forms depending on the context.

Source: Universal Lemmatizer: A Sequence to Sequence Model for Lemmatizing Universal Dependencies Treebanks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 141–150 of 351 papers

Title	Date	Tasks	Status
CroDeriV: a new resource for processing Croatian morphology	May 1, 2014	LemmatizationMorphological Analysis	—Unverified
An Analysis of Lemmatization on Topic Models of Morphologically Rich Language	Aug 13, 2016	ArticlesLemmatization	—Unverified
A data-driven approach to verbal multiword expression detection. PARSEME Shared Task system description paper	Apr 1, 2017	feature selectionLemmatization	—Unverified
A Comparative Study of Hybrid Models in Health Misinformation Text Classification	Oct 8, 2024	LemmatizationMisinformation	—Unverified
Counting What Counts: Decompounding for Keyphrase Extraction	Jul 1, 2015	ChunkingInformation Retrieval	—Unverified
Corpora and Processing Tools for Non-standard Contemporary and Diachronic Balkan Slavic	Sep 1, 2019	LemmatizationPOS	—Unverified
CoRoLa --- The Reference Corpus of Contemporary Romanian Language	May 1, 2014	LemmatizationSentence	—Unverified
Coreference Resolution in FreeLing 4.0	May 1, 2018	Constituency Parsingcoreference-resolution	—Unverified
ASOBEK at SemEval-2016 Task 1: Sentence Representation with Character N-gram Embeddings for Semantic Textual Similarity	Jun 1, 2016	Language ModelingLanguage Modelling	—Unverified
Analysing cross-lingual transfer in lemmatisation for Indian languages	Dec 1, 2020	Cross-Lingual TransferLemmatization	—Unverified

Show:10 25 50

← PrevPage 15 of 36Next →

No leaderboard results yet.