SOTAVerified|Agents Browse Leaderboard About Blog

Lemmatization

Lemmatization is a process of determining a base or dictionary form (lemma) for a given surface form. Especially for languages with rich morphology it is important to be able to normalize words into their base forms to better support for example search engines and linguistic studies. Main difficulties in Lemmatization arise from encountering previously unseen words during inference time as well as disambiguating ambiguous surface forms which can be inflected variants of several different base forms depending on the context.

Source: Universal Lemmatizer: A Sequence to Sequence Model for Lemmatizing Universal Dependencies Treebanks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 351 papers

Title	Date	Tasks	Status	Hype
Evaluating Shortest Edit Script Methods for Contextual Lemmatization	Mar 25, 2024	LEMMALemmatization	CodeCode Available	0
BanLemma: A Word Formation Dependent Rule and Dictionary Based Bangla Lemmatizer	Nov 6, 2023	LemmatizationSentence	CodeCode Available	0
The effect of stemming and lemmatization on Portuguese fake news text classification	Oct 17, 2023	LemmatizationNews Classification	—Unverified	0
Sentence Embedding Models for Ancient Greek Using Multilingual Knowledge Distillation	Aug 24, 2023	Authorship AttributionKnowledge Distillation	CodeCode Available	1
Advancing Hungarian Text Processing with HuSpaCy: Efficient and Accurate NLP Pipelines	Aug 24, 2023	AllBoundary Detection	CodeCode Available	1
Lexicon and Rule-based Word Lemmatization Approach for the Somali Language	Aug 3, 2023	ArticlesInformation Retrieval	CodeCode Available	0
Vacaspati: A Diverse Corpus of Bangla Literature	Jul 11, 2023	LemmatizationPOS	—Unverified	0
Hybrid lemmatization in HuSpaCy	Jun 13, 2023	Lemmatization	CodeCode Available	1
Exploring Large Language Models for Classical Philology	May 23, 2023	BenchmarkingDecoder	CodeCode Available	1
Advancing Full-Text Search Lemmatization Techniques with Paradigm Retrieval from OpenCorpora	May 18, 2023	LEMMALemmatization	—Unverified	0

Show:10 25 50

← PrevPage 3 of 36Next →

No leaderboard results yet.