Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1175 of 1209 papers

Title	Date	Tasks	Status
Indigenous language technologies in Canada: Assessment, challenges, and successes	Aug 1, 2018	Machine TranslationOptical Character Recognition	—Unverified
Indonesian ID Card Extractor Using Optical Character Recognition and Natural Language Post-Processing	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Information Extraction from Scanned Invoice Images using Text Analysis and Layout Features	Aug 8, 2022	Optical Character Recognition (OCR)	—Unverified
Information Extraction from Unstructured data using Augmented-AI and Computer Vision	Dec 15, 2023	Optical Character Recognition (OCR)	—Unverified
Information Retrieval from the Digitized Books	Dec 2, 2022	Image RetrievalInformation Retrieval	—Unverified
Integrating Optical Character Recognition and Machine Translation of Historical Documents	Dec 1, 2016	Language ModelingLanguage Modelling	—Unverified
Integration of Text-maps in Convolutional Neural Networks for Region Detection among Different Textual Categories	May 26, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Intelligent Automation for FDI Facilitation: Optimizing Tariff Exemption Processes with OCR And Large Language Models	Jun 12, 2025	Large Language ModelOptical Character Recognition	—Unverified
Intelligent Document Processing -- Methods and Tools in the real world	Dec 28, 2021	Document ClassificationOptical Character Recognition (OCR)	—Unverified
Interpretable Distance Metric Learning for Handwritten Chinese Character Recognition	Mar 17, 2021	DiversityHandwriting Recognition	—Unverified
Introducing One Sided Margin Loss for Solving Classification Problems in Deep Networks	Jun 2, 2022	ClassificationOptical Character Recognition	—Unverified
Introducing the Reference Corpus of Contemporary Portuguese Online	May 1, 2012	Optical Character Recognition (OCR)	—Unverified
Investigating the Decoders of Maximum Likelihood Sequence Models: A Look-ahead Approach	Mar 8, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
Invisible Threats: Backdoor Attack in OCR Systems	Oct 12, 2023	Backdoor AttackOptical Character Recognition	—Unverified
Is Cognition consistent with Perception? Assessing and Mitigating Multimodal Knowledge Conflicts in Document Understanding	Nov 12, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Is it possible to recover personal health information from an automatically de-identified corpus of French EHRs?	Sep 1, 2015	Optical Character Recognition (OCR)	—Unverified
Iterative Learning for Reliable Crowdsourcing Systems	Dec 1, 2011	image-classificationImage Classification	—Unverified
JaPOC: Japanese Post-OCR Correction Benchmark using Vouchers	Sep 30, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
JoyType: A Robust Design for Multilingual Visual Text Creation	Sep 26, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
K-Algorithm A Modified Technique for Noise Removal in Handwritten Documents	Jun 6, 2013	BinarizationOptical Character Recognition (OCR)	—Unverified
Key Information Extraction in Purchase Documents using Deep Learning and Rule-based Corrections	Oct 7, 2022	Key Information ExtractionLine Detection	—Unverified
Khattat: Enhancing Readability and Concept Representation of Semantic Typography	Oct 1, 2024	Language ModelingLanguage Modelling	—Unverified
KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding	Feb 20, 2025	document understandingOptical Character Recognition	—Unverified
Knowledge Discovery in Optical Music Recognition: Enhancing Information Retrieval with Instance Segmentation	Aug 27, 2024	Information RetrievalInstance Segmentation	—Unverified
Language Classification and Segmentation of Noisy Documents in Hebrew Scripts	Apr 1, 2012	ClassificationGeneral Classification	—Unverified

Show:10 25 50

← PrevPage 47 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified