SOTAVerified|Agents Browse Leaderboard About Blog

Lexical Normalization

Lexical normalization is the task of translating/transforming a non standard text to a standard register.

Example:

new pix comming tomoroe
new pictures coming tomorrow

Datasets usually consists of tweets, since these naturally contain a fair amount of these phenomena.

For lexical normalization, only replacements on the word-level are annotated. Some corpora include annotation for 1-N and N-1 replacements. However, word insertion/deletion and reordering is not part of the task.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 47 papers

Title	Date	Tasks	Status	Hype	Score
ÚFAL at MultiLexNorm 2021: Improving Multilingual Lexical Normalization by Fine-tuning ByT5	Oct 28, 2021	Dependency ParsingLanguage Modeling	CodeCode Available	1	5
ViLexNorm: A Lexical Normalization Corpus for Vietnamese Social Media Text	Jan 29, 2024	Lexical NormalizationVietnamese Lexical Normalization	CodeCode Available	1	5
Modeling Input Uncertainty in Neural Network Dependency Parsing	Oct 1, 2018	Dependency ParsingLexical Normalization	CodeCode Available	0	5
DaN+: Danish Nested Named Entities and Lexical Normalization	May 24, 2021	Cross-Lingual TransferLexical Normalization	CodeCode Available	0	5
A Clustering Framework for Lexical Normalization of Roman Urdu	Mar 31, 2020	ClusteringLexical Normalization	CodeCode Available	0	5
Lexical Normalization for Code-switched Data and its Effect on POS Tagging	Apr 1, 2021	Lexical NormalizationPOS	CodeCode Available	0	5
Adapting Deep Learning for Sentiment Classification of Code-Switched Informal Short Text	Jan 4, 2020	ClassificationGeneral Classification	CodeCode Available	0	5
A Multi-cascaded Deep Model for Bilingual SMS Classification	Nov 29, 2019	ClassificationGeneral Classification	CodeCode Available	0	5
Adapting Sequence to Sequence models for Text Normalization in Social Media	Apr 12, 2019	DecoderLexical Normalization	CodeCode Available	0	5
Automatic Textual Normalization for Hate Speech Detection	Nov 12, 2023	Hate Speech DetectionLexical Normalization	CodeCode Available	0	5

Show:10 25 50

← PrevPage 1 of 5Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MoNoise	Accuracy	87.63	—	Unverified
2	Syllable based	Accuracy	86.08	—	Unverified
3	TextNorm	Accuracy	83.94	—	Unverified
4	unLOL	Accuracy	82.06	—	Unverified