Handwritten Text Recognition

Handwritten Text Recognition (HTR) is the task of automatically identifying and transcribing handwritten text from images or scanned documents into machine-readable text. The goal is to develop a system capable of accurately interpreting diverse handwriting styles, accounting for variations in alignment, stroke, spacing, and noise. This task involves detecting handwritten regions within an image, extracting the text content, and converting it into a structured digital format, enabling further search, indexing, or data analysis.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 139 papers

Title	Date	Tasks	Status	Hype
Advancing Offline Handwritten Text Recognition: A Systematic Review of Data Augmentation and Generation Techniques	Jul 8, 2025	Data AugmentationHandwritten Text Recognition	—Unverified	0
Learning to Align: Addressing Character Frequency Distribution Shifts in Handwritten Text Recognition	Jun 11, 2025	Handwritten Text Recognition	CodeCode Available	0
MetaWriter: Personalized Handwritten Text Recognition Using Meta-Learned Prompt Tuning	May 26, 2025	Handwritten Text RecognitionHTR	—Unverified	0
Preserving Privacy Without Compromising Accuracy: Machine Unlearning for Handwritten Text Recognition	Apr 11, 2025	Handwritten Text RecognitionHTR	—Unverified	0
Meta-DAN: towards an efficient prediction strategy for page-level handwritten text recognition	Apr 4, 2025	GPUHandwritten Text Recognition	CodeCode Available	1
TRIDIS: A Comprehensive Medieval and Early Modern Corpus for HTR and NER	Mar 25, 2025	Handwritten Text RecognitionHTR	—Unverified	0
Benchmarking Large Language Models for Handwritten Text Recognition	Mar 19, 2025	BenchmarkingHandwritten Text Recognition	—Unverified	0
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription	Feb 27, 2025	Handwritten Text RecognitionHTR	CodeCode Available	0
Handwritten Text Recognition: A Survey	Feb 12, 2025	BenchmarkingHandwritten Text Recognition	—Unverified	0
Col-OLHTR: A Novel Framework for Multimodal Online Handwritten Text Recognition	Feb 10, 2025	DecoderHandwritten Text Recognition	—Unverified	0
HAND: Hierarchical Attention Network for Multi-Scale Handwritten Document Recognition and Layout Analysis	Dec 25, 2024	Computational EfficiencyHandwritten Document Recognition	CodeCode Available	0
HTR-JAND: Handwritten Text Recognition with Joint Attention Network and Knowledge Distillation	Dec 24, 2024	Computational EfficiencyHandwritten Text Recognition	CodeCode Available	0
On the Generalization of Handwritten Text Recognition Models	Nov 26, 2024	Domain AdaptationDomain Generalization	—Unverified	0
Nuremberg Letterbooks: A Multi-Transcriptional Dataset of Early 15th Century Manuscripts for Document Analysis	Nov 11, 2024	Handwritten Text Recognition	—Unverified	0
Unlocking the Archives: Using Large Language Models to Transcribe Handwritten Historical Documents	Nov 2, 2024	Handwritten Text RecognitionHTR	CodeCode Available	2
Integrating Canonical Neural Units and Multi-Scale Training for Handwritten Text Recognition	Oct 24, 2024	DecoderHandwritten Text Recognition	—Unverified	0
Hespi: A pipeline for automatically detecting information from hebarium specimen sheets	Oct 11, 2024	Handwritten Text RecognitionHTR	CodeCode Available	1
HATFormer: Historic Handwritten Arabic Text Recognition with Transformers	Oct 3, 2024	DecoderHandwritten Text Recognition	—Unverified	0
HTR-VT: Handwritten Text Recognition with Vision Transformer	Sep 13, 2024	Handwritten Text RecognitionHTR	CodeCode Available	2
Platypus: A Generalized Specialist Model for Reading Text in Various Forms	Aug 27, 2024	Handwritten Text RecognitionOptical Character Recognition (OCR)	—Unverified	0
DANIEL: A fast Document Attention Network for Information Extraction and Labelling of handwritten documents	Jul 12, 2024	Document Layout Analysisdocument understanding	CodeCode Available	1
Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition	Jun 13, 2024	Handwritten Text RecognitionHTR	CodeCode Available	1
Arabic Handwritten Text for Person Biometric Identification: A Deep Learning Approach	Jun 1, 2024	Deep LearningHandwritten Text Recognition	—Unverified	0
Revisiting N-Gram Models: Their Impact in Modern Neural Networks for Handwritten Text Recognition	Apr 30, 2024	Handwriting RecognitionHandwritten Text Recognition	—Unverified	0
End-to-end information extraction in handwritten documents: Understanding Paris marriage records from 1880 to 1940	Apr 30, 2024	Handwritten Text Recognition	—Unverified	0

Show:10 25 50

← PrevPage 1 of 6Next →

All datasets IAM LAM(line-level)IAM(line-level)READ2016(line-level)Belfort READ 2016 Bentham Digital Peter HKR IAM-B IAM-D Saint Gall

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Transformer w/ CNN	CER	7.62	—	Unverified
2	FPHR Paragraph Level (~145 dpi)	CER	6.7	—	Unverified
3	Leaky LP Cell	CER	6.6	—	Unverified
4	FPHR+Aug Line Level (~145 dpi)	CER	6.5	—	Unverified
5	Start, Follow, Read	CER	6.4	—	Unverified
6	Decouple Attention Network	CER	6.4	—	Unverified
7	FPHR+Aug Paragraph Level (~145 dpi)	CER	6.3	—	Unverified
8	Easter2.0	CER	6.21	—	Unverified
9	HTR-VT(line-level)	CER	4.7	—	Unverified
10	Transformer w/ CNN (+synth)	CER	4.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GFCN	Test CER	5.2	—	Unverified
2	TrOCR	Test CER	3.6	—	Unverified
3	OrigamiNet-18	Test CER	3.1	—	Unverified
4	OrigamiNet-12	Test CER	3.1	—	Unverified
5	OrigamiNet-24	Test CER	3	—	Unverified
6	HTR-VT	Test CER	2.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GFCN	Test CER	8	—	Unverified
2	OrigamiNet-12	Test CER	6	—	Unverified
3	VAN	Test CER	5	—	Unverified
4	HTR-VT	Test CER	4.7	—	Unverified
5	TrOCR	Test CER	3.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN + BLSTM	Test CER	4.7	—	Unverified
2	Span	Test CER	4.6	—	Unverified
3	DAN	Test CER	4.1	—	Unverified
4	VAN	Test CER	4.1	—	Unverified
5	HTR-VT	Test CER	3.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PyLaia (human transcriptions + random split)	CER (%)	10.54	—	Unverified
2	PyLaia (human transcriptions + agreement-based split)	CER (%)	5.57	—	Unverified
3	PyLaia (rover consensus + agreement-based split)	CER (%)	4.95	—	Unverified
4	PyLaia (all transcriptions + agreement-based split)	CER (%)	4.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HTR-VT(line-level)	CER (%)	3.9	—	Unverified
2	DAN	CER (%)	3.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StackMix+Blots	CER	1.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StackMix+Blots	CER	2.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StackMix+Blots	CER	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StackMix+Blots	CER	3.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StackMix+Blots	CER	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StackMix+Blots	CER	3.65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAN	CER (%)	6.46	—	Unverified