Key Information Extraction

Key Information Extraction (KIE) is aimed at extracting structured information (e.g. key-value pairs) from form-style documents (e.g. invoices), which makes an important step towards intelligent document understanding.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 74 papers

Title	Date	Tasks	Status	Score
Information Redundancy and Biases in Public Document Information Extraction Benchmarks	Apr 28, 2023	document understandingKey Information Extraction	CodeCode Available	5
Automatic Metadata Extraction Incorporating Visual Features from Scanned Electronic Theses and Dissertations	Jul 1, 2021	Key Information ExtractionOptical Character Recognition (OCR)	CodeCode Available	5
AMuRD: Annotated Arabic-English Receipt Dataset for Key Information Extraction and Classification	Sep 18, 2023	ClassificationKey Information Extraction	CodeCode Available	5
Different Tastes of Entities: Investigating Human Label Variation in Named Entity Annotations	Feb 2, 2024	Key Information Extractionnamed-entity-recognition	CodeCode Available	5
LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding	Dec 29, 2020	Document Image ClassificationDocument Layout Analysis	CodeCode Available	5
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking	Apr 18, 2022	cross-modal alignmentDocument AI	CodeCode Available	5
RDU: A Region-based Approach to Form-style Document Understanding	Jun 14, 2022	document understandingForm	—Unverified	0
RealKIE: Five Novel Datasets for Enterprise Key Information Extraction	Mar 29, 2024	Key Information ExtractionOptical Character Recognition (OCR)	—Unverified	0
Relational Representation Learning in Visually-Rich Documents	May 5, 2022	Contrastive LearningKey Information Extraction	—Unverified	0
Comparison of biomedical relationship extraction methods and models for knowledge graph creation	Jan 5, 2022	Key Information ExtractionKnowledge Graphs	—Unverified	0
Retrieval Augmented Structured Generation: Business Document Information Extraction As Tool Use	May 30, 2024	document understandingKey Information Extraction	—Unverified	0
SIMARA: a database for key-value information extraction from full pages	Apr 26, 2023	Handwriting RecognitionHandwritten Text Recognition	—Unverified	0
Spatial Dual-Modality Graph Reasoning for Key Information Extraction	Mar 26, 2021	Key Information ExtractionTemplate Matching	—Unverified	0
UniVIE: A Unified Label Space Approach to Visual Information Extraction from Form-like Documents	Jan 17, 2024	DecoderForm	—Unverified	0
ViBERTgrid: A Jointly Trained Multi-Modal 2D Document Representation for Key Information Extraction from Documents	May 25, 2021	Image SegmentationKey Information Extraction	—Unverified	0
ViBERTgrid BiLSTM-CRF: Multimodal Key Information Extraction from Unstructured Financial Documents	Sep 23, 2024	Key Information Extractionnamed-entity-recognition	—Unverified	0
VKIE: The Application of Key Information Extraction on Video Text	Oct 18, 2023	Key Information Extraction	—Unverified	0
"What is the value of templates?" Rethinking Document Information Extraction Datasets for LLMs	Oct 20, 2024	document understandingKey Information Extraction	—Unverified	0
See then Tell: Enhancing Key Information Extraction with Vision Grounding	Sep 29, 2024	Image to textKey Information Extraction	—Unverified	0
A LayoutLMv3-Based Model for Enhanced Relation Extraction in Visually-Rich Documents	Apr 16, 2024	document understandingKey Information Extraction	—Unverified	0
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy	Dec 3, 2024	HallucinationKey Information Extraction	—Unverified	0
Construction of a Syntactic Analysis Map for Yi Shui School through Text Mining and Natural Language Processing Research	Feb 16, 2024	graph constructionInformation Retrieval	—Unverified	0
Data Efficient Training of a U-Net Based Architecture for Structured Documents Localization	Oct 2, 2023	DecoderDeep Learning	—Unverified	0
Deep Learning based Key Information Extraction from Business Documents: Systematic Literature Review	Jul 23, 2024	Deep Learningdocument understanding	—Unverified	0
DONUT-hole: DONUT Sparsification by Harnessing Knowledge and Optimizing Learning Efficiency	Nov 9, 2023	document understandingKey Information Extraction	—Unverified	0

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets CORD SROIE Kleister NDA SIMARA

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	RORE (GeoLayoutLM)	F1	98.52	—	Unverified
2	GeoLayoutLM	F1	97.97	—	Unverified
3	LayoutLMv3 Large	F1	97.46	—	Unverified
4	LayoutMask (large)	F1	97.19	—	Unverified
5	LayoutMask (base)	F1	96.99	—	Unverified
6	TPP (LayoutMask)	F1	96.92	—	Unverified
7	LILT	F1	96.07	—	Unverified
8	LayoutLMv2LARGE	F1	96.01	—	Unverified
9	LayoutLMv2BASE	F1	94.95	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LayoutLMv2LARGE (Excluding OCR mismatch)	F1	97.81	—	Unverified
2	RORE (GeoLayoutLM)	F1	96.97	—	Unverified
3	LayoutLMv2LARGE	F1	96.61	—	Unverified
4	LayoutLMv2BASE	F1	96.25	—	Unverified
5	ChatGPT 3.5 SpatialFormat	Accuracy	77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LayoutLMv2LARGE	F1	85.2	—	Unverified
2	LayoutLMv2BASE	F1	83.3	—	Unverified
3	LAMBERT (75M)	F1	80.42	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAN	F1 (%)	95.05	—	Unverified