Named Entity Recognition (NER)

Named Entity Recognition (NER) is a task of Natural Language Processing (NLP) that involves identifying and classifying named entities in a text into predefined categories such as person names, organizations, locations, and others. The goal of NER is to extract structured information from unstructured text data and represent it in a machine-readable format. Approaches typically use BIO notation, which differentiates the beginning (B) and the inside (I) of entities. O is used for non-entity tokens.

Example:

| Mark | Watney | visited | Mars | | --- | ---| --- | --- | | B-PER | I-PER | O | B-LOC |

( Image credit: Zalando )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 2874 papers

Title	Date	Tasks	Status	Hype	Score
AraELECTRA: Pre-Training Text Discriminators for Arabic Language Understanding	Dec 31, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
Boundary Smoothing for Named Entity Recognition	Apr 26, 2022	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
A Comparative Study of Pre-trained Encoders for Low-Resource Named Entity Recognition	Apr 11, 2022	Contrastive LearningLow Resource Named Entity Recognition	CodeCode Available	1	5
Improving Distantly-Supervised Named Entity Recognition with Self-Collaborative Denoising Learning	Oct 9, 2021	Denoisingnamed-entity-recognition	CodeCode Available	1	5
calamanCy: A Tagalog Natural Language Processing Toolkit	Nov 13, 2023	Dependency Parsingnamed-entity-recognition	CodeCode Available	1	5
CAMeL Tools: An Open Source Python Toolkit for Arabic Natural Language Processing	May 1, 2020	Arabic Sentiment AnalysisArabic Text Diacritization	CodeCode Available	1	5
A Label-Aware Autoregressive Framework for Cross-Domain NER	Jul 1, 2022	Cross-Domain Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
Improving Neural Named Entity Recognition with Gazetteers	Mar 6, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
A Large-Scale Chinese Multimodal NER Dataset with Speech Clues	Aug 1, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
Causal Distillation for Language Models	Dec 5, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
A Comparative Study of Pretrained Language Models for Long Clinical Text	Jan 27, 2023	Clinical KnowledgeDocument Classification	CodeCode Available	1	5
Actionable Entities Recognition Benchmark for Interactive Fiction	Sep 28, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
IndicNLPSuite: Monolingual Corpora, Evaluation Benchmarks and Pre-trained Multilingual Language Models for Indian Languages	Nov 8, 2020	Genre classificationMultiple-choice	CodeCode Available	1	5
Information Extraction of Clinical Trial Eligibility Criteria	Jun 12, 2020	ClusteringDiversity	CodeCode Available	1	5
A Robust and Domain-Adaptive Approach for Low-Resource Named Entity Recognition	Jan 2, 2021	Low Resource Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
AlephBERT:A Hebrew Large Pre-Trained Language Model to Start-off your Hebrew NLP Application With	Apr 8, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Interpretable Multi-dataset Evaluation for Named Entity Recognition	Nov 13, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
CHisIEC: An Information Extraction Corpus for Ancient Chinese History	Mar 22, 2024	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
Clinical-Longformer and Clinical-BigBird: Transformers for long clinical sequences	Jan 27, 2022	Clinical KnowledgeDocument Classification	CodeCode Available	1	5
Coach: A Coarse-to-Fine Approach for Cross-domain Slot Filling	Apr 24, 2020	Cross-Domain Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
A Twitter Corpus for Named Entity Recognition in Turkish	Jun 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
ConNER: Consistency Training for Cross-lingual Named Entity Recognition	Nov 17, 2022	Cross-Lingual NERKnowledge Distillation	CodeCode Available	1	5
Coarse-to-Fine Pre-training for Named Entity Recognition	Oct 16, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
KALA: Knowledge-Augmented Language Model Adaptation	Apr 22, 2022	Domain AdaptationGeneral Knowledge	CodeCode Available	1	5
Code and Named Entity Recognition in StackOverflow	May 4, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
A Sequence-to-Set Network for Nested Named Entity Recognition	May 19, 2021	Decodernamed-entity-recognition	CodeCode Available	1	5
A Unified Generative Framework for Various NER Subtasks	Jun 2, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
Computer Science Named Entity Recognition in the Open Research Knowledge Graph	Mar 28, 2022	Articlesnamed-entity-recognition	CodeCode Available	1	5
Annotating the Tweebank Corpus on Named Entity Recognition and Building NLP Models for Social Media Analysis	Jan 18, 2022	Dependency Parsingnamed-entity-recognition	CodeCode Available	1	5
A Simple but Effective Approach to Improve Structured Language Model Output for Information Extraction	Feb 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Computationally Efficient NER Taggers with Combined Embeddings and Constrained Decoding	Jan 5, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
KoCHET: a Korean Cultural Heritage corpus for Entity-related Tasks	Sep 1, 2022	Entity TypingManagement	CodeCode Available	1	5
Label-Descriptive Patterns and Their Application to Characterizing Classification Errors	Oct 18, 2021	Descriptivenamed-entity-recognition	CodeCode Available	1	5
Label-Guided In-Context Learning for Named Entity Recognition	May 29, 2025	In-Context Learningnamed-entity-recognition	CodeCode Available	1	5
SeqScore: Addressing Barriers to Reproducible Named Entity Recognition Evaluation	Jul 29, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
COPNER: Contrastive Learning with Prompt Guiding for Few-shot Named Entity Recognition	Oct 1, 2022	Contrastive Learningfew-shot-ner	CodeCode Available	1	5
CONTaiNER: Few-Shot Named Entity Recognition via Contrastive Learning	Sep 15, 2021	Contrastive LearningFew-shot NER	CodeCode Available	1	5
A Span-Based Model for Joint Overlapped and Discontinuous Named Entity Recognition	Jun 28, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
A Unified MRC Framework for Named Entity Recognition	Oct 25, 2019	Chinese Named Entity RecognitionEntity Extraction using GAN	CodeCode Available	1	5
Entity, Relation, and Event Extraction with Contextualized Span Representations	Sep 8, 2019	Event ExtractionJoint Entity and Relation Extraction	CodeCode Available	1	5
Contextualized Embeddings in Named-Entity Recognition: An Empirical Study on Generalization	Jan 22, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
Locate and Label: A Two-stage Identifier for Nested Named Entity Recognition	May 14, 2021	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech Recognition and Natural Language Understanding of Air Traffic Control Communications	Nov 8, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
Automated Concatenation of Embeddings for Structured Prediction	Oct 10, 2020	Aspect ExtractionChunking	CodeCode Available	1	5
COVID-19 Named Entity Recognition for Vietnamese	Apr 8, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1	5
MarkBERT: Marking Word Boundaries Improves Chinese BERT	Nov 16, 2021	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
MASK: A flexible framework to facilitate de-identification of clinical texts	May 24, 2020	De-identificationnamed-entity-recognition	CodeCode Available	1	5
MatSciBERT: A Materials Domain Language Model for Text Mining and Information Extraction	Sep 30, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
CrossNER: Evaluating Cross-Domain Named Entity Recognition	Dec 8, 2020	Cross-Domain Named Entity RecognitionDomain Adaptation	CodeCode Available	1	5
DeepStruct: Pretraining of Language Models for Structure Prediction	May 21, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1	5

Show:10 25 50

← PrevPage 7 of 58Next →

All datasets CoNLL 2003 (English)Ontonotes v5 (English)NCBI Disease WNUT 2017 ACE 2005 JNLPBA BC5CDR GENIA BC2GM BC5CDR-chemical SLUE CoNLL++

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE + document-context	F1	94.6	—	Unverified
2	LUKE 483M	F1	94.3	—	Unverified
3	Co-regularized LUKE	F1	94.22	—	Unverified
4	LUKE + SubRegWeigh (K-means)	F1	94.2	—	Unverified
5	ASP+T5-3B	F1	94.1	—	Unverified
6	FLERT XLM-R	F1	94.09	—	Unverified
7	PL-Marker	F1	94	—	Unverified
8	CL-KL	F1	93.85	—	Unverified
9	XLNet-GCN	F1	93.82	—	Unverified
10	RoBERTa + SubRegWeigh (K-means)	F1	93.81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT-MRC+DSC	F1	92.07	—	Unverified
2	PL-Marker	F1	91.9	—	Unverified
3	Baseline + BS	F1	91.74	—	Unverified
4	Biaffine-NER	F1	91.3	—	Unverified
5	BERT-MRC	F1	91.11	—	Unverified
6	PIQN	F1	90.96	—	Unverified
7	HGN	F1	90.92	—	Unverified
8	Syn-LSTM + BERT (wo doc-context)	F1	90.85	—	Unverified
9	DiffusionNER	F1	90.66	—	Unverified
10	W2NER	F1	90.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT	F1	89.71	—	Unverified
2	SpanModel + SequenceLabelingModel	F1	89.6	—	Unverified
3	SciFive-Base	F1	89.39	—	Unverified
4	Spark NLP	F1	89.13	—	Unverified
5	BLSTM-CNN-Char (SparkNLP)	F1	89.13	—	Unverified
6	KeBioLM	F1	89.1	—	Unverified
7	CL-KL	F1	88.96	—	Unverified
8	BioKMNER + BioBERT	F1	88.77	—	Unverified
9	BioLinkBERT (large)	F1	88.76	—	Unverified
10	CompactBioBERT	F1	88.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CL-KL	F1	60.45	—	Unverified
2	RoBERTa + SubRegWeigh (K-means)	F1	60.29	—	Unverified
3	BERT-CRF (Replicated in AdaSeq)	F1	59.69	—	Unverified
4	RoBERTa-BiLSTM-context	F1	59.61	—	Unverified
5	BERT + RegLER	F1	58.9	—	Unverified
6	TNER -xlm-r-large	F1	58.5	—	Unverified
7	HGN	F1	57.41	—	Unverified
8	ASA + RoBERTa	F1	57.3	—	Unverified
9	BERTweet	F1	56.5	—	Unverified
10	MINER	F1	54.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours: cross-sentence ALB	F1	90.9	—	Unverified
2	GoLLIE	F1	89.6	—	Unverified
3	PromptNER [RoBERTa-large]	F1	88.26	—	Unverified
4	PIQN	F1	87.42	—	Unverified
5	PromptNER [BERT-large]	F1	87.21	—	Unverified
6	DiffusionNER	F1	86.93	—	Unverified
7	BERT-MRC	F1	86.88	—	Unverified
8	UniNER-7B	F1	86.69	—	Unverified
9	Locate and Label	F1	86.67	—	Unverified
10	BoningKnife	F1	85.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	KeBioLM	F1	82	—	Unverified
2	BLSTM-CNN-Char (SparkNLP)	F1	81.29	—	Unverified
3	Spark NLP	F1	81.29	—	Unverified
4	BINDER	F1	80.3	—	Unverified
5	BioMobileBERT	F1	80.13	—	Unverified
6	BioLinkBERT (large)	F1	80.06	—	Unverified
7	DistilBioBERT	F1	79.97	—	Unverified
8	CompactBioBERT	F1	79.88	—	Unverified
9	BioDistilBERT	F1	79.1	—	Unverified
10	PubMedBERT uncased	F1	79.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BINDER	F1	91.9	—	Unverified
2	ConNER	F1	91.3	—	Unverified
3	CL-L2	F1	90.99	—	Unverified
4	aimped	F1	90.95	—	Unverified
5	BertForTokenClassification (Spark NLP)	F1	90.89	—	Unverified
6	BioLinkBERT (large)	F1	90.22	—	Unverified
7	ELECTRAMed	F1	90.03	—	Unverified
8	BLSTM-CNN-Char (SparkNLP)	F1	89.73	—	Unverified
9	Spark NLP	F1	89.73	—	Unverified
10	UniNER-7B	F1	89.34	—	Unverified