Named Entity Recognition (NER)

Named Entity Recognition (NER) is a task of Natural Language Processing (NLP) that involves identifying and classifying named entities in a text into predefined categories such as person names, organizations, locations, and others. The goal of NER is to extract structured information from unstructured text data and represent it in a machine-readable format. Approaches typically use BIO notation, which differentiates the beginning (B) and the inside (I) of entities. O is used for non-entity tokens.

Example:

| Mark | Watney | visited | Mars | | --- | ---| --- | --- | | B-PER | I-PER | O | B-LOC |

( Image credit: Zalando )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 2874 papers

Title	Date	Tasks	Status	Hype
TOE: A Grid-Tagging Discontinuous NER Model Enhanced by Embedding Tag/Word Relations and More Fine-Grained Tags	Nov 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Autoregressive Structured Prediction with Language Models	Oct 26, 2022	Coreference ResolutionNamed Entity Recognition	CodeCode Available	1
Unsupervised Text Deidentification	Oct 20, 2022	Named Entity RecognitionNamed Entity Recognition (NER)	CodeCode Available	1
Multi-Granularity Cross-Modality Representation Learning for Named Entity Recognition on Social Media	Oct 19, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
End-to-End Entity Detection with Proposer and Regressor	Oct 19, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation Extraction from Financial Documents	Oct 17, 2022	BenchmarkingJoint Entity and Relation Extraction	CodeCode Available	1
Style Transfer as Data Augmentation: A Case Study on Named Entity Recognition	Oct 14, 2022	Data AugmentationDiversity	CodeCode Available	1
HUE: Pretrained Model and Dataset for Understanding Hanja Documents of Ancient Korea	Oct 11, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
SEE-Few: Seed, Expand and Entail for Few-shot Named Entity Recognition	Oct 11, 2022	Few-shot NERLow Resource Named Entity Recognition	CodeCode Available	1
Deep Span Representations for Named Entity Recognition	Oct 9, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Distilling Causal Effect from Miscellaneous Other-Class for Continual Named Entity Recognition	Oct 8, 2022	Causal InferenceContinual Learning	CodeCode Available	1
Distillation-Resistant Watermarking for Model Protection in NLP	Oct 7, 2022	modelNamed Entity Recognition	CodeCode Available	1
COPNER: Contrastive Learning with Prompt Guiding for Few-shot Named Entity Recognition	Oct 1, 2022	Contrastive Learningfew-shot-ner	CodeCode Available	1
METS-CoV: A Dataset of Medical Entity and Targeted Sentiment on COVID-19 Related Tweets	Sep 28, 2022	Epidemiologynamed-entity-recognition	CodeCode Available	1
A general-purpose material property data extraction pipeline from large polymer corpora using Natural Language Processing	Sep 27, 2022	ArticlesLanguage Modeling	CodeCode Available	1
Application of Deep Learning in Generating Structured Radiology Reports: A Transformer-Based Technique	Sep 25, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
On the Effectiveness of Compact Biomedical Transformers	Sep 7, 2022	Continual LearningKnowledge Distillation	CodeCode Available	1
SCL-RAI: Span-based Contrastive Learning with Retrieval Augmented Inference for Unlabeled Entity Problem in NER	Sep 4, 2022	Contrastive Learningnamed-entity-recognition	CodeCode Available	1
KoCHET: a Korean Cultural Heritage corpus for Entity-related Tasks	Sep 1, 2022	Entity TypingManagement	CodeCode Available	1
Optimizing Bi-Encoder for Named Entity Recognition via Contrastive Learning	Aug 30, 2022	Contrastive LearningMetric Learning	CodeCode Available	1
Domain-Specific NER via Retrieving Correlated Samples	Aug 27, 2022	Named Entity RecognitionNamed Entity Recognition (NER)	CodeCode Available	1
FactMix: Using a Few Labeled In-domain Examples to Generalize to Cross-domain Named Entity Recognition	Aug 24, 2022	Cross-Domain Named Entity RecognitionData Augmentation	CodeCode Available	1
An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition	Aug 9, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Good Visual Guidance Make A Better Extractor: Hierarchical Visual Prefix for Multimodal Entity and Relation Extraction	Jul 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
End-to-End Chinese Speaker Identification	Jul 1, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
Multi-features based Semantic Augmentation Networks for Named Entity Recognition in Threat Intelligence	Jul 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
A Label-Aware Autoregressive Framework for Cross-Domain NER	Jul 1, 2022	Cross-Domain Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1
MultiNERD: A Multilingual, Multi-Genre and Fine-Grained Dataset for Named Entity Recognition (and Disambiguation)	Jul 1, 2022	Entity Linkingnamed-entity-recognition	CodeCode Available	1
NERDA-Con: Extending NER models for Continual Learning -- Integrating Distinct Tasks and Updating Distribution Shifts	Jun 28, 2022	Continual Learningnamed-entity-recognition	CodeCode Available	1
Endowing Language Models with Multimodal Knowledge Graph Representations	Jun 27, 2022	Multilingual Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1
TOKEN is a MASK: Few-shot Named Entity Recognition with Pre-trained Language Models	Jun 15, 2022	DescriptiveDomain Adaptation	CodeCode Available	1
SsciBERT: A Pre-trained Language Model for Social Science Texts	Jun 9, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Enhanced Entity Annotations for Multilingual Corpora	Jun 1, 2022	ArticlesEntity Linking	CodeCode Available	1
A Twitter Corpus for Named Entity Recognition in Turkish	Jun 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
hmBERT: Historical Multilingual Language Models for Named Entity Recognition	May 31, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
FinBERT-MRC: financial named entity recognition using BERT under the machine reading comprehension paradigm	May 31, 2022	Machine Reading Comprehensionnamed-entity-recognition	CodeCode Available	1
RuNNE-2022 Shared Task: Recognizing Nested Named Entities	May 23, 2022	Dialogue Evaluationnamed-entity-recognition	CodeCode Available	1
Pre-training Data Quality and Quantity for a Low-Resource Language: New Corpus and BERT Models for Maltese	May 21, 2022	Cross-Lingual TransferDependency Parsing	CodeCode Available	1
DeepStruct: Pretraining of Language Models for Structure Prediction	May 21, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
Wojood: Nested Arabic Named Entity Corpus and Recognition using BERT	May 19, 2022	Multi-Task Learningnamed-entity-recognition	CodeCode Available	1
Hero-Gang Neural Model For Named Entity Recognition	May 15, 2022	modelnamed-entity-recognition	CodeCode Available	1
ViT5: Pretrained Text-to-Text Transformer for Vietnamese Language Generation	May 13, 2022	Abstractive Text SummarizationDecoder	CodeCode Available	1
NFLAT: Non-Flat-Lattice Transformer for Chinese Named Entity Recognition	May 12, 2022	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1
Ontology-Driven and Weakly Supervised Rare Disease Identification from Clinical Notes	May 11, 2022	Entity Linkingnamed-entity-recognition	CodeCode Available	1
Good Visual Guidance Makes A Better Extractor: Hierarchical Visual Prefix for Multimodal Entity and Relation Extraction	May 7, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Wav2Seq: Pre-training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages	May 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
GNNer: Reducing Overlapping in Span-based NER Using Graph Neural Networks	May 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Thai Nested Named Entity Recognition Corpus	May 1, 2022	ArticlesLanguage Modeling	CodeCode Available	1
Polyglot Prompt: Multilingual Multitask PrompTraining	Apr 29, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
HiNER: A Large Hindi Named Entity Recognition Dataset	Apr 28, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 58Next →

All datasets CoNLL 2003 (English)Ontonotes v5 (English)NCBI Disease WNUT 2017 ACE 2005 JNLPBA BC5CDR GENIA BC2GM BC5CDR-chemical SLUE CoNLL++

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE + document-context	F1	94.6	—	Unverified
2	LUKE 483M	F1	94.3	—	Unverified
3	Co-regularized LUKE	F1	94.22	—	Unverified
4	LUKE + SubRegWeigh (K-means)	F1	94.2	—	Unverified
5	ASP+T5-3B	F1	94.1	—	Unverified
6	FLERT XLM-R	F1	94.09	—	Unverified
7	PL-Marker	F1	94	—	Unverified
8	CL-KL	F1	93.85	—	Unverified
9	XLNet-GCN	F1	93.82	—	Unverified
10	RoBERTa + SubRegWeigh (K-means)	F1	93.81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT-MRC+DSC	F1	92.07	—	Unverified
2	PL-Marker	F1	91.9	—	Unverified
3	Baseline + BS	F1	91.74	—	Unverified
4	Biaffine-NER	F1	91.3	—	Unverified
5	BERT-MRC	F1	91.11	—	Unverified
6	PIQN	F1	90.96	—	Unverified
7	HGN	F1	90.92	—	Unverified
8	Syn-LSTM + BERT (wo doc-context)	F1	90.85	—	Unverified
9	DiffusionNER	F1	90.66	—	Unverified
10	W2NER	F1	90.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT	F1	89.71	—	Unverified
2	SpanModel + SequenceLabelingModel	F1	89.6	—	Unverified
3	SciFive-Base	F1	89.39	—	Unverified
4	Spark NLP	F1	89.13	—	Unverified
5	BLSTM-CNN-Char (SparkNLP)	F1	89.13	—	Unverified
6	KeBioLM	F1	89.1	—	Unverified
7	CL-KL	F1	88.96	—	Unverified
8	BioKMNER + BioBERT	F1	88.77	—	Unverified
9	BioLinkBERT (large)	F1	88.76	—	Unverified
10	CompactBioBERT	F1	88.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CL-KL	F1	60.45	—	Unverified
2	RoBERTa + SubRegWeigh (K-means)	F1	60.29	—	Unverified
3	BERT-CRF (Replicated in AdaSeq)	F1	59.69	—	Unverified
4	RoBERTa-BiLSTM-context	F1	59.61	—	Unverified
5	BERT + RegLER	F1	58.9	—	Unverified
6	TNER -xlm-r-large	F1	58.5	—	Unverified
7	HGN	F1	57.41	—	Unverified
8	ASA + RoBERTa	F1	57.3	—	Unverified
9	BERTweet	F1	56.5	—	Unverified
10	MINER	F1	54.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours: cross-sentence ALB	F1	90.9	—	Unverified
2	GoLLIE	F1	89.6	—	Unverified
3	PromptNER [RoBERTa-large]	F1	88.26	—	Unverified
4	PIQN	F1	87.42	—	Unverified
5	PromptNER [BERT-large]	F1	87.21	—	Unverified
6	DiffusionNER	F1	86.93	—	Unverified
7	BERT-MRC	F1	86.88	—	Unverified
8	UniNER-7B	F1	86.69	—	Unverified
9	Locate and Label	F1	86.67	—	Unverified
10	BoningKnife	F1	85.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	KeBioLM	F1	82	—	Unverified
2	BLSTM-CNN-Char (SparkNLP)	F1	81.29	—	Unverified
3	Spark NLP	F1	81.29	—	Unverified
4	BINDER	F1	80.3	—	Unverified
5	BioMobileBERT	F1	80.13	—	Unverified
6	BioLinkBERT (large)	F1	80.06	—	Unverified
7	DistilBioBERT	F1	79.97	—	Unverified
8	CompactBioBERT	F1	79.88	—	Unverified
9	BioDistilBERT	F1	79.1	—	Unverified
10	PubMedBERT uncased	F1	79.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BINDER	F1	91.9	—	Unverified
2	ConNER	F1	91.3	—	Unverified
3	CL-L2	F1	90.99	—	Unverified
4	aimped	F1	90.95	—	Unverified
5	BertForTokenClassification (Spark NLP)	F1	90.89	—	Unverified
6	BioLinkBERT (large)	F1	90.22	—	Unverified
7	ELECTRAMed	F1	90.03	—	Unverified
8	BLSTM-CNN-Char (SparkNLP)	F1	89.73	—	Unverified
9	Spark NLP	F1	89.73	—	Unverified
10	UniNER-7B	F1	89.34	—	Unverified