SOTAVerified|Agents Browse Leaderboard About

Lemmatization

Lemmatization is a process of determining a base or dictionary form (lemma) for a given surface form. Especially for languages with rich morphology it is important to be able to normalize words into their base forms to better support for example search engines and linguistic studies. Main difficulties in Lemmatization arise from encountering previously unseen words during inference time as well as disambiguating ambiguous surface forms which can be inflected variants of several different base forms depending on the context.

Source: Universal Lemmatizer: A Sequence to Sequence Model for Lemmatizing Universal Dependencies Treebanks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 341–350 of 351 papers

Title	Date	Tasks	Status
Chimera -- Three Heads for English-to-Czech Translation	Aug 1, 2013	LemmatizationMachine Translation	—Unverified
CNGL-CORE: Referential Translation Machines for Measuring Semantic Similarity	Jun 1, 2013	LemmatizationMachine Translation	—Unverified
Comparison of Current Approaches to Lemmatization: A Case Study in Estonian	Apr 23, 2024	ClassificationLemmatization	—Unverified
Compounds and distributional thesauri	May 1, 2014	LemmatizationMachine Translation	—Unverified
Constraint 2021: Machine Learning Models for COVID-19 Fake News Detection Shared Task	Jan 11, 2021	BIG-bench Machine LearningFake News Detection	—Unverified
Context Aware Lemmatization and Morphological Tagging Method in Turkish	Jan 4, 2025	LemmatizationMorphological Tagging	—Unverified
Context based lemmatizer for Polish language	Jul 23, 2022	LEMMALemmatization	—Unverified
Context Sensitive Lemmatization Using Two Successive Bidirectional Gated Recurrent Networks	Jul 1, 2017	AttributeLEMMA	—Unverified
Context Sensitive Neural Lemmatization with Lematus	Jun 1, 2018	DecoderLemmatization	—Unverified
Coreference Resolution in FreeLing 4.0	May 1, 2018	Constituency Parsingcoreference-resolution	—Unverified

Show:10 25 50

← PrevPage 35 of 36Next →

No leaderboard results yet.