Named Entity Recognition (NER)

Named Entity Recognition (NER) is a task of Natural Language Processing (NLP) that involves identifying and classifying named entities in a text into predefined categories such as person names, organizations, locations, and others. The goal of NER is to extract structured information from unstructured text data and represent it in a machine-readable format. Approaches typically use BIO notation, which differentiates the beginning (B) and the inside (I) of entities. O is used for non-entity tokens.

Example:

| Mark | Watney | visited | Mars | | --- | ---| --- | --- | | B-PER | I-PER | O | B-LOC |

( Image credit: Zalando )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 2874 papers

Title	Date	Tasks	Status	Hype
A Simple but Effective Approach to Improve Structured Language Model Output for Information Extraction	Feb 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition	Feb 7, 2024	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
The Radiation Oncology NLP Database	Jan 19, 2024	Language ModellingLarge Language Model	CodeCode Available	1
Filtered Semi-Markov CRF	Nov 29, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
GSAP-NER: A Novel Task, Corpus, and Baseline for Scholarly Entity Extraction Focused on Machine Learning Models and Datasets	Nov 16, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Self-Improving for Zero-Shot Named Entity Recognition with Large Language Models	Nov 15, 2023	In-Context Learningnamed-entity-recognition	CodeCode Available	1
Universal NER: A Gold-Standard Multilingual Named Entity Recognition Benchmark	Nov 15, 2023	Cross-Lingual NERMultilingual Named Entity Recognition	CodeCode Available	1
calamanCy: A Tagalog Natural Language Processing Toolkit	Nov 13, 2023	Dependency Parsingnamed-entity-recognition	CodeCode Available	1
Developing a Named Entity Recognition Dataset for Tagalog	Nov 13, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
CleanCoNLL: A Nearly Noise-Free Named Entity Recognition Dataset	Oct 24, 2023	Entity Linkingnamed-entity-recognition	CodeCode Available	1
NERetrieve: Dataset for Next Generation Named Entity Recognition and Retrieval	Oct 22, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
HEProto: A Hierarchical Enhancing ProtoNet based on Multi-Task Learning for Few-shot Named Entity Recognition	Oct 21, 2023	Contrastive LearningFew-shot NER	CodeCode Available	1
Enhancing Low-resource Fine-grained Named Entity Recognition by Leveraging Coarse-grained Datasets	Oct 18, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Reading Order Matters: Information Extraction from Visually-rich Documents by Token Path Prediction	Oct 17, 2023	Entity LinkingKey Information Extraction	CodeCode Available	1
Empirical Study of Zero-Shot NER with ChatGPT	Oct 16, 2023	Arithmetic Reasoningnamed-entity-recognition	CodeCode Available	1
Label Supervised LLaMA Finetuning	Oct 2, 2023	GPUnamed-entity-recognition	CodeCode Available	1
DiscoverPath: A Knowledge Refinement and Retrieval System for Interdisciplinarity on Biomedical Research	Sep 4, 2023	Articlesnamed-entity-recognition	CodeCode Available	1
Advancing Hungarian Text Processing with HuSpaCy: Efficient and Accurate NLP Pipelines	Aug 24, 2023	AllBoundary Detection	CodeCode Available	1
ACLM: A Selective-Denoising based Generative Data Augmentation Approach for Low-Resource Complex NER	Jun 1, 2023	Data AugmentationDenoising	CodeCode Available	1
Supplementary Features of BiLSTM for Enhanced Sequence Labeling	May 31, 2023	Aspect-Based Sentiment AnalysisChinese Named Entity Recognition	CodeCode Available	1
E-NER: Evidential Deep Learning for Trustworthy Named Entity Recognition	May 29, 2023	Deep Learningnamed-entity-recognition	CodeCode Available	1
PromptNER: Prompt Locating and Typing for Named Entity Recognition	May 26, 2023	Cross-Domain Few-ShotEntity Typing	CodeCode Available	1
DiffusionNER: Boundary Diffusion for Named Entity Recognition	May 22, 2023	Chinese Named Entity RecognitionDenoising	CodeCode Available	1
PromptNER: A Prompting Method for Few-shot Named Entity Recognition via k Nearest Neighbor Search	May 20, 2023	few-shot-nerFew-shot NER	CodeCode Available	1
From Zero to Hero: Harnessing Transformers for Biomedical Named Entity Recognition in Zero- and Few-shot Contexts	May 5, 2023	few-shot-nerFew-shot NER	CodeCode Available	1
ViMQ: A Vietnamese Medical Question Dataset for Healthcare Dialogue System Development	Apr 27, 2023	intent-classificationIntent Classification	CodeCode Available	1
FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system	Apr 21, 2023	CPUGPU	CodeCode Available	1
EasyNER: A Customizable Easy-to-Use Pipeline for Deep Learning- and Dictionary-based Named Entity Recognition from Medical Text	Apr 16, 2023	Articlesnamed-entity-recognition	CodeCode Available	1
Improving Large Language Models for Clinical Named Entity Recognition via Prompt Engineering	Mar 29, 2023	Few-Shot LearningLanguage Modelling	CodeCode Available	1
DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4	Mar 20, 2023	BenchmarkingDe-identification	CodeCode Available	1
A Human Subject Study of Named Entity Recognition (NER) in Conversational Music Recommendation Queries	Mar 13, 2023	Music Recommendationnamed-entity-recognition	CodeCode Available	1
A Neural Span-Based Continual Named Entity Recognition Model	Feb 23, 2023	Continual LearningContinual Named Entity Recognition	CodeCode Available	1
FiNER-ORD: Financial Named Entity Recognition Open Research Dataset	Feb 22, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Meta-Learning Triplet Network with Adaptive Margins for Few-Shot Named Entity Recognition	Feb 14, 2023	few-shot-nerFew-shot NER	CodeCode Available	1
Type-Aware Decomposed Framework for Few-Shot Named Entity Recognition	Feb 13, 2023	Contrastive LearningFew-shot NER	CodeCode Available	1
Lightweight Transformers for Clinical Natural Language Processing	Feb 9, 2023	Continual LearningKnowledge Distillation	CodeCode Available	1
Unleashing the True Potential of Sequence-to-Sequence Models for Sequence Tagging and Structure Parsing	Feb 5, 2023	Dependency Parsingnamed-entity-recognition	CodeCode Available	1
Bioformer: an efficient transformer language model for biomedical text mining	Feb 3, 2023	ArticlesDocument Classification	CodeCode Available	1
A Comparative Study of Pretrained Language Models for Long Clinical Text	Jan 27, 2023	Clinical KnowledgeDocument Classification	CodeCode Available	1
ViDeBERTa: A powerful pre-trained language model for Vietnamese	Jan 25, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Naamapadam: A Large-Scale Named Entity Annotated Data for Indic Languages	Dec 20, 2022	Named Entity RecognitionNamed Entity Recognition (NER)	CodeCode Available	1
AIONER: All-in-one scheme-based biomedical named entity recognition using deep learning	Nov 30, 2022	AllMulti-Task Learning	CodeCode Available	1
Joint Multimodal Entity-Relation Extraction Based on Edge-enhanced Graph Alignment Network and Word-pair Relation Tagging	Nov 28, 2022	graph constructionnamed-entity-recognition	CodeCode Available	1
PUnifiedNER: A Prompting-based Unified NER System for Diverse Datasets	Nov 27, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Hengam: An Adversarially Trained Transformer for Persian Temporal Tagging	Nov 20, 2022	Information RetrievalNamed Entity Recognition (NER)	CodeCode Available	1
GENIUS: Sketch-based Language Model Pre-training via Extreme and Selective Masking for Text Generation and Augmentation	Nov 18, 2022	Conditional Text GenerationData Augmentation	CodeCode Available	1
ConNER: Consistency Training for Cross-lingual Named Entity Recognition	Nov 17, 2022	Cross-Lingual NERKnowledge Distillation	CodeCode Available	1
Prompt-Based Metric Learning for Few-Shot NER	Nov 8, 2022	few-shot-nerFew-shot NER	CodeCode Available	1
ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech Recognition and Natural Language Understanding of Air Traffic Control Communications	Nov 8, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Named Entity Recognition in Indian court judgments	Nov 7, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 58Next →

All datasets CoNLL 2003 (English)Ontonotes v5 (English)NCBI Disease WNUT 2017 ACE 2005 JNLPBA BC5CDR GENIA BC2GM BC5CDR-chemical SLUE CoNLL++

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE + document-context	F1	94.6	—	Unverified
2	LUKE 483M	F1	94.3	—	Unverified
3	Co-regularized LUKE	F1	94.22	—	Unverified
4	LUKE + SubRegWeigh (K-means)	F1	94.2	—	Unverified
5	ASP+T5-3B	F1	94.1	—	Unverified
6	FLERT XLM-R	F1	94.09	—	Unverified
7	PL-Marker	F1	94	—	Unverified
8	CL-KL	F1	93.85	—	Unverified
9	XLNet-GCN	F1	93.82	—	Unverified
10	RoBERTa + SubRegWeigh (K-means)	F1	93.81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT-MRC+DSC	F1	92.07	—	Unverified
2	PL-Marker	F1	91.9	—	Unverified
3	Baseline + BS	F1	91.74	—	Unverified
4	Biaffine-NER	F1	91.3	—	Unverified
5	BERT-MRC	F1	91.11	—	Unverified
6	PIQN	F1	90.96	—	Unverified
7	HGN	F1	90.92	—	Unverified
8	Syn-LSTM + BERT (wo doc-context)	F1	90.85	—	Unverified
9	DiffusionNER	F1	90.66	—	Unverified
10	W2NER	F1	90.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT	F1	89.71	—	Unverified
2	SpanModel + SequenceLabelingModel	F1	89.6	—	Unverified
3	SciFive-Base	F1	89.39	—	Unverified
4	BLSTM-CNN-Char (SparkNLP)	F1	89.13	—	Unverified
5	Spark NLP	F1	89.13	—	Unverified
6	KeBioLM	F1	89.1	—	Unverified
7	CL-KL	F1	88.96	—	Unverified
8	BioKMNER + BioBERT	F1	88.77	—	Unverified
9	BioLinkBERT (large)	F1	88.76	—	Unverified
10	CompactBioBERT	F1	88.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CL-KL	F1	60.45	—	Unverified
2	RoBERTa + SubRegWeigh (K-means)	F1	60.29	—	Unverified
3	BERT-CRF (Replicated in AdaSeq)	F1	59.69	—	Unverified
4	RoBERTa-BiLSTM-context	F1	59.61	—	Unverified
5	BERT + RegLER	F1	58.9	—	Unverified
6	TNER -xlm-r-large	F1	58.5	—	Unverified
7	HGN	F1	57.41	—	Unverified
8	ASA + RoBERTa	F1	57.3	—	Unverified
9	BERTweet	F1	56.5	—	Unverified
10	MINER	F1	54.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours: cross-sentence ALB	F1	90.9	—	Unverified
2	GoLLIE	F1	89.6	—	Unverified
3	PromptNER [RoBERTa-large]	F1	88.26	—	Unverified
4	PIQN	F1	87.42	—	Unverified
5	PromptNER [BERT-large]	F1	87.21	—	Unverified
6	DiffusionNER	F1	86.93	—	Unverified
7	BERT-MRC	F1	86.88	—	Unverified
8	UniNER-7B	F1	86.69	—	Unverified
9	Locate and Label	F1	86.67	—	Unverified
10	BoningKnife	F1	85.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	KeBioLM	F1	82	—	Unverified
2	BLSTM-CNN-Char (SparkNLP)	F1	81.29	—	Unverified
3	Spark NLP	F1	81.29	—	Unverified
4	BINDER	F1	80.3	—	Unverified
5	BioMobileBERT	F1	80.13	—	Unverified
6	BioLinkBERT (large)	F1	80.06	—	Unverified
7	DistilBioBERT	F1	79.97	—	Unverified
8	CompactBioBERT	F1	79.88	—	Unverified
9	BioDistilBERT	F1	79.1	—	Unverified
10	PubMedBERT uncased	F1	79.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BINDER	F1	91.9	—	Unverified
2	ConNER	F1	91.3	—	Unverified
3	CL-L2	F1	90.99	—	Unverified
4	aimped	F1	90.95	—	Unverified
5	BertForTokenClassification (Spark NLP)	F1	90.89	—	Unverified
6	BioLinkBERT (large)	F1	90.22	—	Unverified
7	ELECTRAMed	F1	90.03	—	Unverified
8	Spark NLP	F1	89.73	—	Unverified
9	BLSTM-CNN-Char (SparkNLP)	F1	89.73	—	Unverified
10	UniNER-7B	F1	89.34	—	Unverified