Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 1209 papers

Title	Date	Tasks	Status
Deep Structured Feature Networks for Table Detection and Tabular Data Extraction from Scanned Financial Document Images	Feb 20, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Classical Approach to Handcrafted Feature Extraction Techniques for Bangla Handwritten Digit Recognition	Jan 25, 2022	Handwritten Digit RecognitionOptical Character Recognition (OCR)	—Unverified
GlyphMastero: A Glyph Encoder for High-Fidelity Scene Text Editing	May 8, 2025	Optical Character Recognition (OCR)Scene Text Editing	—Unverified
GMN: Generative Multi-modal Network for Practical Document Information Extraction	Jul 11, 2022	Optical Character Recognition (OCR)	—Unverified
Implementation of a Workflow Management System for Non-Expert Users	Dec 1, 2016	ManagementOptical Character Recognition (OCR)	—Unverified
Improve CAPTCHA's Security Using Gaussian Blur Filter	Oct 16, 2014	Optical Character Recognition (OCR)	—Unverified
Improve Sentence Alignment by Divide-and-conquer	Jan 18, 2022	Optical Character Recognition (OCR)Sentence	—Unverified
Ground Truth for training OCR engines on historical documents in German Fraktur and Early Modern Latin	Sep 14, 2018	Optical Character Recognition (OCR)	—Unverified
Grouping Language Model Boundary Words to Speed K--Best Extraction from Hypergraphs	Jun 1, 2013	Language ModelingLanguage Modelling	—Unverified
GroupLink: An End-to-end Multitask Method for Word Grouping and Relation Extraction in Form Understanding	May 10, 2021	FormOptical Character Recognition (OCR)	—Unverified
Improving Amharic Handwritten Word Recognition Using Auxiliary Task	Feb 25, 2022	Handwritten Text RecognitionOptical Character Recognition	—Unverified
Information Extraction from Unstructured data using Augmented-AI and Computer Vision	Dec 15, 2023	Optical Character Recognition (OCR)	—Unverified
Deep Reader: Information extraction from Document images via relation extraction and Natural Language	Dec 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Deep Learning Based Vehicle Tracking System Using License Plate Detection And Recognition	May 10, 2020	GPULicense Plate Detection	—Unverified
Automatic Compositor Attribution in the First Folio of Shakespeare	Apr 25, 2017	ClusteringOptical Character Recognition (OCR)	—Unverified
Deep Learning Based Traffic Surveillance System For Missing and Suspicious Car Detection	Jul 17, 2020	Generative Adversarial NetworkOptical Character Recognition	—Unverified
Deep learning-based NLP Data Pipeline for EHR Scanned Document Information Extraction	Sep 14, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Automatic Classification of Pathology Reports using TF-IDF Features	Mar 5, 2019	ClassificationDiagnostic	—Unverified
An Efficient Language-Independent Multi-Font OCR for Arabic Script	Sep 18, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Deep Learning Approach for Receipt Recognition	May 30, 2019	DecoderDeep Learning	—Unverified
Automated Translation of a Literary Work: A Pilot Study	Jun 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Advancing Generative Model Evaluation: A Novel Algorithm for Realistic Image Synthesis and Comparison in OCR System	Feb 27, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
Deductron -- A Recurrent Neural Network	Jun 23, 2018	Image to textOptical Character Recognition (OCR)	—Unverified
Decoding Anagrammed Texts Written in an Unknown Language and Script	Jan 1, 2016	DeciphermentLanguage Identification	—Unverified
Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive	Nov 2, 2020	HTROptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 21 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified