Key Information Extraction

Key Information Extraction (KIE) is aimed at extracting structured information (e.g. key-value pairs) from form-style documents (e.g. invoices), which makes an important step towards intelligent document understanding.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 74 papers

Title	Date	Tasks	Status	Hype
PaddleOCR 3.0 Technical Report	Jul 8, 2025	document understandingKey Information Extraction	—Unverified	0
Class-Agnostic Region-of-Interest Matching in Document Images	Jun 26, 2025	Document Layout Analysisdocument understanding	CodeCode Available	0
Hallucinations and Key Information Extraction in Medical Texts: A Comprehensive Assessment of Open-Source Large Language Models	Apr 27, 2025	Key Information ExtractionNatural Language Understanding	—Unverified	0
Emergency Communication: OTFS-Based Semantic Transmission with Diffusion Noise Suppression	Apr 10, 2025	DenoisingKey Information Extraction	—Unverified	0
KIEval: Evaluation Metric for Document Key Information Extraction	Mar 7, 2025	Key Information Extraction	—Unverified	0
OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models	Feb 22, 2025	document understandingKey Information Extraction	—Unverified	0
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy	Dec 3, 2024	HallucinationKey Information Extraction	—Unverified	0
"What is the value of templates?" Rethinking Document Information Extraction Datasets for LLMs	Oct 20, 2024	document understandingKey Information Extraction	—Unverified	0
GraphRevisedIE: Multimodal Information Extraction with Graph-Revised Network	Oct 2, 2024	Key Information Extraction	CodeCode Available	0
Modeling Layout Reading Order as Ordering Relations for Visually-rich Document Understanding	Sep 29, 2024	document understandingEntity Linking	CodeCode Available	1
See then Tell: Enhancing Key Information Extraction with Vision Grounding	Sep 29, 2024	Image to textKey Information Extraction	—Unverified	0
ViBERTgrid BiLSTM-CRF: Multimodal Key Information Extraction from Unstructured Financial Documents	Sep 23, 2024	Key Information Extractionnamed-entity-recognition	—Unverified	0
Information Extraction from Visually Rich Documents Using Directed Weighted Graph Neural Network	Sep 11, 2024	Document Layout Analysisdocument understanding	CodeCode Available	0
Deep Learning based Key Information Extraction from Business Documents: Systematic Literature Review	Jul 23, 2024	Deep Learningdocument understanding	—Unverified	0
A Bounding Box is Worth One Token: Interleaving Layout and Text in a Large Language Model for Document Understanding	Jul 2, 2024	document understandingKey Information Extraction	CodeCode Available	2
Retrieval Augmented Structured Generation: Business Document Information Extraction As Tool Use	May 30, 2024	document understandingKey Information Extraction	—Unverified	0
XFormParser: A Simple and Effective Multimodal Multilingual Semi-structured Form Parser	May 27, 2024	Document AIForm	CodeCode Available	0
KVP10k : A Comprehensive Dataset for Key-Value Pair Extraction in Business Documents	May 1, 2024	DiversityKey Information Extraction	CodeCode Available	1
A LayoutLMv3-Based Model for Enhanced Relation Extraction in Visually-Rich Documents	Apr 16, 2024	document understandingKey Information Extraction	—Unverified	0
RealKIE: Five Novel Datasets for Enterprise Key Information Extraction	Mar 29, 2024	Key Information ExtractionOptical Character Recognition (OCR)	—Unverified	0
OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition	Mar 28, 2024	Decoderdocument understanding	—Unverified	0
TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document	Mar 7, 2024	document understandingKey Information Extraction	CodeCode Available	5
Construction of a Syntactic Analysis Map for Yi Shui School through Text Mining and Natural Language Processing Research	Feb 16, 2024	graph constructionInformation Retrieval	—Unverified	0
LAPDoc: Layout-Aware Prompting for Documents	Feb 15, 2024	document understandingKey Information Extraction	—Unverified	0
Different Tastes of Entities: Investigating Human Label Variation in Named Entity Annotations	Feb 2, 2024	Key Information Extractionnamed-entity-recognition	CodeCode Available	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets CORD SROIE Kleister NDA SIMARA

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	RORE (GeoLayoutLM)	F1	98.52	—	Unverified
2	GeoLayoutLM	F1	97.97	—	Unverified
3	LayoutLMv3 Large	F1	97.46	—	Unverified
4	LayoutMask (large)	F1	97.19	—	Unverified
5	LayoutMask (base)	F1	96.99	—	Unverified
6	TPP (LayoutMask)	F1	96.92	—	Unverified
7	LILT	F1	96.07	—	Unverified
8	LayoutLMv2LARGE	F1	96.01	—	Unverified
9	LayoutLMv2BASE	F1	94.95	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LayoutLMv2LARGE (Excluding OCR mismatch)	F1	97.81	—	Unverified
2	RORE (GeoLayoutLM)	F1	96.97	—	Unverified
3	LayoutLMv2LARGE	F1	96.61	—	Unverified
4	LayoutLMv2BASE	F1	96.25	—	Unverified
5	ChatGPT 3.5 SpatialFormat	Accuracy	77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LayoutLMv2LARGE	F1	85.2	—	Unverified
2	LayoutLMv2BASE	F1	83.3	—	Unverified
3	LAMBERT (75M)	F1	80.42	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAN	F1 (%)	95.05	—	Unverified