Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–575 of 1209 papers

Title	Date	Tasks	Status
A Novel Transfer Learning Approach upon Hindi, Arabic, and Bangla Numerals using Convolutional Neural Networks	Jul 26, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Hybrid Swarm and Gravitation based feature selection algorithm for Handwritten Indic Script Classification problem	May 10, 2020	Classificationfeature selection	—Unverified
Efficient Medical VIE via Reinforcement Learning	Jun 16, 2025	DiversityOptical Character Recognition (OCR)	—Unverified
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Efficient Media Retrieval from Non-Cooperative Queries	Nov 19, 2014	Optical Character Recognition (OCR)Retrieval	—Unverified
A Novel Pipeline for Improving Optical Character Recognition through Post-processing Using Natural Language Processing	Jul 9, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Efficient, Lexicon-Free OCR using Deep Learning	Jun 5, 2019	Data AugmentationDeep Learning	—Unverified
Efficient few-shot learning for pixel-precise handwritten document layout analysis	Oct 27, 2022	Document Layout AnalysisFew-Shot Learning	—Unverified
Building A Handwritten Cuneiform Character Imageset	May 1, 2018	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Efficient End-to-End Visual Document Understanding with Rationale Distillation	Nov 16, 2023	document understandingImage to text	—Unverified
Effective search space reduction for spell correction using character neural embeddings	Apr 1, 2017	Optical Character Recognition (OCR)	—Unverified
Building a Corpus from Handwritten Picture Postcards: Transcription, Annotation and Part-of-Speech Tagging	May 1, 2018	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
A Novel Method for the Recognition of Isolated Handwritten Arabic Characters	Feb 26, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Hybrid Defense Method against Adversarial Attacks on Traffic Sign Classifiers in Autonomous Vehicles	Apr 25, 2022	Autonomous VehiclesNavigate	—Unverified
Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages	Aug 26, 2022	DiversityOptical Character Recognition (OCR)	—Unverified
Éclair -- Extracting Content and Layout with Integrated Reading Order for Documents	Feb 6, 2025	Image CaptioningOptical Character Recognition	—Unverified
Budget-Optimal Task Allocation for Reliable Crowdsourcing Systems	Oct 17, 2011	image-classificationImage Classification	—Unverified
EASTER: Efficient and Scalable Text Recognizer	Aug 18, 2020	BenchmarkingHandwritten Text Recognition	—Unverified
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified
A Novel Machine Learning Based Approach for Post-OCR Error Detection	Sep 1, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Broken News: Making Newspapers Accessible to Print-Impaired	Jun 21, 2022	Instance SegmentationOptical Character Recognition (OCR)	—Unverified
A Novel Approach to Skew-Detection and Correction of English Alphabets for OCR	Jan 2, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
E2E Process Automation Leveraging Generative AI and IDP-Based Automation Agent: A Case Study on Corporate Expense Processing	May 27, 2025	Decision MakingOptical Character Recognition (OCR)	—Unverified
Dynamic Programming Approach to Template-based OCR	Dec 19, 2018	Optical Character Recognition (OCR)Position	—Unverified
Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting	Jul 14, 2022	global-optimizationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 23 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified