Document Layout Analysis

"Document Layout Analysis is performed to determine physical structure of a document, that is, to determine document components. These document components can consist of single connected components-regions [...] of pixels that are adjacent to form single regions [...] , or group of text lines. A text line is a group of characters, symbols, and words that are adjacent, “relatively close” to each other and through which a straight line can be drawn (usually with horizontal or vertical orientation)." L. O'Gorman, "The document spectrum for page layout analysis," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 15, no. 11, pp. 1162-1173, Nov. 1993.

Image credit: PubLayNet: largest dataset ever for document layout analysis

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–99 of 99 papers

Title	Date	Tasks	Status
U-DIADS-Bib: a full and few-shot pixel-precise dataset for document layout analysis of ancient manuscripts	Jan 16, 2024	Document Layout Analysis	—Unverified
Multimodal weighted graph representation for information extraction from visually rich documents.	Jan 5, 2024	Document Layout Analysisdocument understanding	CodeCode Available
Object Recognition from Scientific Document based on Compartment Refinement Framework	Dec 14, 2023	ArticlesDocument Layout Analysis	—Unverified
DCQA: Document-Level Chart Question Answering towards Complex Reasoning and Common-Sense Understanding	Oct 29, 2023	Answer GenerationChart Question Answering	CodeCode Available
DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond	Oct 19, 2023	Document AIDocument Layout Analysis	—Unverified
Bengali Document Layout Analysis -- A YOLOV8 Based Ensembling Approach	Sep 2, 2023	Data AugmentationDocument Layout Analysis	—Unverified
Document Layout Analysis on BaDLAD Dataset: A Comprehensive MViTv2 Based Approach	Aug 31, 2023	Document Layout Analysis	—Unverified
Vision Grid Transformer for Document Layout Analysis	Aug 29, 2023	Document AIDocument Layout Analysis	—Unverified
Bengali Document Layout Analysis with Detectron2	Aug 26, 2023	Data AugmentationDocument Layout Analysis	—Unverified
The YOLO model that still excels in document layout analysis	Aug 22, 2023	DiversityDocument Layout Analysis	—Unverified
Performance Enhancement Leveraging Mask-RCNN on Bengali Document Layout Analysis	Aug 21, 2023	Document Layout Analysis	—Unverified
Framework and Model Analysis on Bengali Document Layout Analysis Dataset: BaDLAD	Aug 15, 2023	Document Layout Analysis	—Unverified
A Graphical Approach to Document Layout Analysis	Aug 3, 2023	Document Layout AnalysisGraph Neural Network	CodeCode Available
Bridging the Performance Gap between DETR and R-CNN for Graphical Object Detection in Document Images	Jun 23, 2023	Document Layout AnalysisObject	—Unverified
Document Layout Annotation: Database and Benchmark in the Domain of Public Affairs	Jun 12, 2023	Document Layout Analysis	CodeCode Available
M^6Doc: A Large-Scale Multi-Format, Multi-Type, Multi-Layout, Multi-Language, Multi-Annotation Category Dataset for Modern Document Layout Analysis	May 15, 2023	ArticlesDocument Layout Analysis	CodeCode Available
Extracting Complex Named Entities in Legal Documents via Weakly Supervised Object Detection	May 10, 2023	Document Layout AnalysisInformation Retrieval	—Unverified
BaDLAD: A Large Multi-Domain Bengali Document Layout Analysis Dataset	Mar 9, 2023	BenchmarkingDeep Learning	CodeCode Available
Détection d'Objets dans les documents numérisés par réseaux de neurones profonds	Jan 27, 2023	Document Layout AnalysisLine Detection	—Unverified
Efficient few-shot learning for pixel-precise handwritten document layout analysis	Oct 27, 2022	Document Layout AnalysisFew-Shot Learning	—Unverified
Transformer-based Approach for Document Understanding	Oct 16, 2022	DecoderDocument Layout Analysis	—Unverified
Unified Pretraining Framework for Document Understanding	Apr 22, 2022	Document Layout Analysisdocument understanding	—Unverified
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking	Apr 18, 2022	cross-modal alignmentDocument AI	CodeCode Available
Neural Graph Matching for Modification Similarity Applied to Electronic Document Comparison	Apr 12, 2022	ArticlesDocument Layout Analysis	—Unverified
DocBed: A Multi-Stage OCR Solution for Documents with Complex Layouts	Feb 3, 2022	ArticlesDocument Layout Analysis	—Unverified
Cross-Domain Document Layout Analysis Using Document Style Guide	Jan 24, 2022	Contrastive LearningDocument Layout Analysis	—Unverified
Document Layout Analysis with Aesthetic-Guided Image Augmentation	Nov 27, 2021	Document Layout Analysisdocument understanding	—Unverified
Document AI: Benchmarks, Models and Applications	Nov 16, 2021	Deep LearningDocument AI	—Unverified
Document Image Layout Analysis via Explicit Edge Embedding Network	Oct 1, 2021	Data AugmentationDocument Layout Analysis	—Unverified
LayoutReader: Pre-training of Text and Layout for Reading Order Detection	Aug 26, 2021	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified
VTLayout: Fusion of Visual and Text Features for Document Layout Analysis	Aug 12, 2021	Document Layout Analysis	—Unverified
Human-In-The-Loop Document Layout Analysis	Aug 4, 2021	Document Layout AnalysisSemantic Segmentation	—Unverified
Evaluation of a Region Proposal Architecture for Multi-task Document Layout Analysis	Jun 22, 2021	Document Layout AnalysisKeyword Spotting	—Unverified
ICDAR 2021 Competition on Historical Map Segmentation	May 27, 2021	Contour DetectionDocument Layout Analysis	CodeCode Available
Document Domain Randomization for Deep Learning Document Layout Extraction	May 20, 2021	Deep LearningDocument Layout Analysis	—Unverified
VSR: A Unified Framework for Document Layout Analysis combining Vision, Semantics and Relations	May 13, 2021	Document Layout AnalysisGraph Neural Network	—Unverified
Document Layout Analysis via Dynamic Residual Feature Fusion	Apr 7, 2021	Document Layout AnalysisOptical Character Recognition	—Unverified
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified
LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding	Dec 29, 2020	Document Image ClassificationDocument Layout Analysis	CodeCode Available
Multiple Document Datasets Pre-training Improves Text Line Detection With Deep Neural Networks	Dec 28, 2020	Document Layout AnalysisLine Detection	—Unverified
Vision-Based Layout Detection from Scientific Literature using Recurrent Convolutional Neural Networks	Oct 18, 2020	Document Layout Analysisobject-detection	—Unverified
VisualWordGrid: Information Extraction From Scanned Documents Using A Multimodal Approach	Oct 5, 2020	Document Layout Analysis	—Unverified
Visual Detection with Context for Document Layout Analysis	Nov 1, 2019	ArticlesDocument Layout Analysis	—Unverified
Multi-Task Handwritten Document Layout Analysis	Jun 22, 2018	Document Layout Analysis	CodeCode Available
dhSegment: A generic deep-learning approach for document segmentation	Apr 27, 2018	Deep LearningDiversity	CodeCode Available
Improving Document Clustering by Removing Unnatural Language	Sep 1, 2017	ClusteringDocument Layout Analysis	—Unverified
DIVA-HisDB: A Precisely Annotated Large Dataset of Challenging Medieval Manuscripts	Oct 23, 2016	BinarizationDocument Layout Analysis	—Unverified
Natural Language Inspired Approach for Handwritten Text Line Detection in Legacy Documents	Apr 1, 2012	Document Layout AnalysisLine Detection	—Unverified
Parameter-free Geometric Document Layout Analysis	Nov 1, 2001	AttributeDocument Layout Analysis	—Unverified

Show:10 25 50

← PrevPage 2 of 2Next →

All datasets PubLayNet val U-DIADS-Bib D4LA Document Layout Recognition Challenge mini-dev Document Layout Recognition Challenge test RVL-CDIP

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CDeC-Net	Table	0.98	—	Unverified
2	VGT	Overall	0.96	—	Unverified
3	TRDLU	Overall	0.96	—	Unverified
4	VSR	Overall	0.96	—	Unverified
5	DETR	Overall	0.96	—	Unverified
6	LayoutLMv3-B	Overall	0.95	—	Unverified
7	DiT-L	Overall	0.95	—	Unverified
8	DoPTA	Overall	0.95	—	Unverified
9	UDoc	Overall	0.94	—	Unverified
10	ResNext-101-32×8d	Overall	0.94	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CV-Group	Class Average IoU	83.4	—	Unverified
2	CNKI	Class Average IoU	77.8	—	Unverified
3	VAI-OCR	Class Average IoU	70.7	—	Unverified
4	DeepLabV3+	Class Average IoU	66.5	—	Unverified
5	L3i++	Class Average IoU (Few-shot setting)	61.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DoPTA	mAP	70.72	—	Unverified
2	DocLayout-YOLO	mAP	70.3	—	Unverified
3	VGT	mAP	68.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster_RCNN	Overall	0.96	—	Unverified
2	fglihai	Overall	0.96	—	Unverified
3	Faster-RCNN	Overall	0.95	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	fglihai	Overall	0.92	—	Unverified
2	USYD NLP_CS29-2	Overall	0.92	—	Unverified
3	Faster-RCNN	Overall	0.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VisualWordGrid	FAR	28.7	—	Unverified