Key Information Extraction

Key Information Extraction (KIE) is aimed at extracting structured information (e.g. key-value pairs) from form-style documents (e.g. invoices), which makes an important step towards intelligent document understanding.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–74 of 74 papers

Title	Date	Tasks	Status
DUBLIN -- Document Understanding By Language-Image Network	May 23, 2023	Document Classificationdocument understanding	—Unverified
Emergency Communication: OTFS-Based Semantic Transmission with Diffusion Noise Suppression	Apr 10, 2025	DenoisingKey Information Extraction	—Unverified
End-to-End Document Classification and Key Information Extraction using Assignment Optimization	Jun 1, 2023	ClassificationDocument Classification	—Unverified
Entity Relation Extraction as Dependency Parsing in Visually Rich Documents	Oct 19, 2021	Dependency ParsingEntity Linking	—Unverified
GeoLayoutLM: Geometric Pre-training for Visual Information Extraction	Apr 21, 2023	Document AIentity_extraction	—Unverified
Hallucinations and Key Information Extraction in Medical Texts: A Comprehensive Assessment of Open-Source Large Language Models	Apr 27, 2025	Key Information ExtractionNatural Language Understanding	—Unverified
ICDAR2019 Competition on Scanned Receipt OCR and Information Extraction	Mar 18, 2021	Key Information ExtractionOptical Character Recognition (OCR)	—Unverified
Information Extraction from Documents: Question Answering vs Token Classification in real-world setups	Apr 21, 2023	ClassificationFew-Shot Learning	—Unverified
Key Information Extraction in Purchase Documents using Deep Learning and Rule-based Corrections	Oct 7, 2022	Key Information ExtractionLine Detection	—Unverified
KIEval: Evaluation Metric for Document Key Information Extraction	Mar 7, 2025	Key Information Extraction	—Unverified
Kleister: Key Information Extraction Datasets Involving Long Documents with Complex Layouts	May 12, 2021	Key Information Extraction	—Unverified
LAPDoc: Layout-Aware Prompting for Documents	Feb 15, 2024	document understandingKey Information Extraction	—Unverified
LayoutMask: Enhance Text-Layout Interaction in Multi-modal Pre-training for Document Understanding	May 30, 2023	document-image-classificationDocument Image Classification	—Unverified
MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding	Aug 14, 2021	Key Information Extractionnamed-entity-recognition	—Unverified
NCU1415 at ROCLING 2022 Shared Task: A light-weight transformer-based approach for Biomedical Name Entity Recognition	Nov 1, 2022	Key Information ExtractionNER	—Unverified
OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition	Mar 28, 2024	Decoderdocument understanding	—Unverified
OmniParser: A Unified Framework for Text Spotting Key Information Extraction and Table Recognition	Jan 1, 2024	Decoderdocument understanding	—Unverified
OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models	Feb 22, 2025	document understandingKey Information Extraction	—Unverified
One-shot Key Information Extraction from Document with Deep Partial Graph Matching	Sep 26, 2021	Graph MatchingKey Information Extraction	—Unverified
PaddleOCR 3.0 Technical Report	Jul 8, 2025	document understandingKey Information Extraction	—Unverified
PDFVQA: A New Dataset for Real-World VQA on PDF Documents	Apr 13, 2023	document understandingKey Information Extraction	—Unverified
PPN: Parallel Pointer-based Network for Key Information Extraction with Complex Layouts	Jul 20, 2023	Key Information Extraction	—Unverified
PP-StructureV2: A Stronger Document Analysis System	Oct 11, 2022	Key Information ExtractionKnowledge Distillation	—Unverified
PrIeD-KIE: Towards Privacy Preserved Document Key Information Extraction	Oct 5, 2023	Document AIFederated Learning	—Unverified

Show:10 25 50

← PrevPage 2 of 2Next →

All datasets CORD SROIE Kleister NDA SIMARA

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	RORE (GeoLayoutLM)	F1	98.52	—	Unverified
2	GeoLayoutLM	F1	97.97	—	Unverified
3	LayoutLMv3 Large	F1	97.46	—	Unverified
4	LayoutMask (large)	F1	97.19	—	Unverified
5	LayoutMask (base)	F1	96.99	—	Unverified
6	TPP (LayoutMask)	F1	96.92	—	Unverified
7	LILT	F1	96.07	—	Unverified
8	LayoutLMv2LARGE	F1	96.01	—	Unverified
9	LayoutLMv2BASE	F1	94.95	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LayoutLMv2LARGE (Excluding OCR mismatch)	F1	97.81	—	Unverified
2	RORE (GeoLayoutLM)	F1	96.97	—	Unverified
3	LayoutLMv2LARGE	F1	96.61	—	Unverified
4	LayoutLMv2BASE	F1	96.25	—	Unverified
5	ChatGPT 3.5 SpatialFormat	Accuracy	77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LayoutLMv2LARGE	F1	85.2	—	Unverified
2	LayoutLMv2BASE	F1	83.3	—	Unverified
3	LAMBERT (75M)	F1	80.42	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAN	F1 (%)	95.05	—	Unverified