Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–625 of 1209 papers

Title	Date	Tasks	Status
SAML-QC: a Stochastic Assessment and Machine Learning based QC technique for Industrial Printing	Jan 18, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified
SARD: A Large-Scale Synthetic Arabic OCR Dataset for Book-Style Text Recognition	May 30, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents	May 19, 2025	Dataset GenerationOptical Character Recognition (OCR)	—Unverified
Scaling Automatic Extraction of Pseudocode	Jun 7, 2024	Code GenerationOptical Character Recognition	—Unverified
Scatteract: Automated extraction of data from scatter plots	Apr 21, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SceneGATE: Scene-Graph based co-Attention networks for TExt visual question answering	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Scene Text recognition with Full Normalization	Jul 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild	Jan 6, 2025	AttributeOptical Character Recognition	—Unverified
SciCapenter: Supporting Caption Composition for Scientific Figures with Machine-Generated Captions and Ratings	Mar 26, 2024	Optical Character Recognition (OCR)	—Unverified
Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models	Jun 25, 2025	document understandingHallucination	—Unverified
Seeing the Signs: A Survey of Edge-Deployable OCR Models for Billboard Visibility Analysis	Jul 15, 2025	MarketingOptical Character Recognition	—Unverified
See then Tell: Enhancing Key Information Extraction with Vision Grounding	Sep 29, 2024	Image to textKey Information Extraction	—Unverified
SEE: Towards Semi-SupervisedEnd-to-End Scene Text Recognition	Dec 14, 2017	Optical Character Recognition (OCR)Scene Text Detection	—Unverified
Segmentation-free Connectionist Temporal Classification loss based OCR Model for Text Captcha Classification	Feb 8, 2024	CAPTCHA DetectionClassification	—Unverified
Self-paced learning to improve text row detection in historical documents with missing labels	Jan 28, 2022	Missing LabelsOptical Character Recognition	—Unverified
Self-supervised Data Bootstrapping for Deep Optical Character Recognition of Identity Documents	Aug 12, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Semantic rule Web-based Diagnosis and Treatment of Vector-Borne Diseases using SWRL rules	Jan 8, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Semantic Segmentation for Real-World and Synthetic Vehicle's Forward-Facing Camera Images	Jul 7, 2024	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
Semi-automated annotation of page-based documents within the Genre and Multimodality framework	Aug 1, 2016	Optical Character Recognition (OCR)	—Unverified
Semi-Structured Query Grounding for Document-Oriented Databases with Deep Retrieval and Its Application to Receipt and POI Matching	Feb 23, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Sequence-to-Label Script Identification for Multilingual OCR	Aug 15, 2017	Optical Character Recognition (OCR)	—Unverified
Sequence to Sequence Learning for Optical Character Recognition	Nov 13, 2015	DecoderGeneral Classification	—Unverified
Sequence-to-Sequence Pre-training with Unified Modality Masking for Visual Document Understanding	May 16, 2023	Decoderdocument understanding	—Unverified
Shakti-VLMs: Scalable Vision-Language Models for Enterprise AI	Feb 24, 2025	document understandingMultimodal Reasoning	—Unverified
Similar Document Template Matching Algorithm	Nov 21, 2023	Fraud DetectionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 25 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified