Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–675 of 1209 papers

Title	Date	Tasks	Status
SVTRv2: CTC Beats Encoder-Decoder Models in Scene Text Recognition	Nov 24, 2024	DecoderOptical Character Recognition (OCR)	—Unverified
SymbioticRAG: Enhancing Document Intelligence Through Human-LLM Symbiotic Collaboration	May 5, 2025	Optical Character Recognition (OCR)RAG	—Unverified
Synergy of Nederlab and	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Synthesizing Annotated Image and Video Data Using a Rendering-Based Pipeline for Improved License Plate Recognition	Sep 28, 2022	Data AugmentationLicense Plate Recognition	—Unverified
Table Structure Extraction with Bi-directional Gated Recurrent Unit Networks	Jan 8, 2020	document understandingOptical Character Recognition	—Unverified
Tablext: A Combined Neural Network And Heuristic Based Table Extractor	Apr 22, 2021	object-detectionObject Detection	—Unverified
Tag, Copy or Predict: A Unified Weakly-Supervised Learning Framework for Visual Information Extraction using Sequences	Jun 20, 2021	DecoderOptical Character Recognition	—Unverified
Tagging Named Entities in 19th Century and Modern Finnish Newspaper Material with a Finnish Semantic Tagger	May 1, 2017	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified
Tamil Vowel Recognition With Augmented MNIST-like Data Set	Jun 9, 2020	ClassificationGeneral Classification	—Unverified
TAP-VL: Text Layout-Aware Pre-training for Enriched Vision-Language Models	Nov 7, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
TC-OCR: TableCraft OCR for Efficient Detection & Recognition of Table Structure & Content	Apr 16, 2024	Information RetrievalKnowledge Graphs	—Unverified
TDeLTA: A Light-weight and Robust Table Detection Method based on Learning Text Arrangement	Dec 18, 2023	Optical Character Recognition (OCR)Table Detection	—Unverified
TECHLIMED@QALB-Shared Task 2015: a hybrid Arabic Error Correction System	Jul 1, 2015	Information RetrievalMachine Translation	—Unverified
TECHLIMED system description for the Shared Task on Automatic Arabic Error Correction	Oct 1, 2014	Information RetrievalMachine Translation	—Unverified
TeLCoS: OnDevice Text Localization with Clustering of Script	Apr 16, 2021	ClusteringImage Categorization	—Unverified
Telugu OCR Framework using Deep Learning	Sep 20, 2015	Deep LearningGeneral Classification	—Unverified
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
TextBlockV2: Towards Precise-Detection-Free Scene Text Spotting with Pre-trained Language Model	Mar 15, 2024	Language ModelingLanguage Modelling	—Unverified
TextCaps: a Dataset for Image Captioning with Reading Comprehension	Mar 24, 2020	Image CaptioningOptical Character Recognition	—Unverified
Text Change Detection in Multilingual Documents Using Image Comparison	Dec 5, 2024	BinarizationChange Detection	—Unverified
Text Detection on Technical Drawings for the Digitization of Brown-field Processes	May 5, 2022	Data Augmentationobject-detection	—Unverified
TextDiffuser: Diffusion Models as Text Painters	May 18, 2023	Optical Character Recognition (OCR)	—Unverified
TextDiffuser-RL: Efficient and Robust Text Layout Optimization for High-Fidelity Text-to-Image Synthesis	May 25, 2025	CPUGPU	—Unverified
Text Extraction and Retrieval from Smartphone Screenshots: Building a Repository for Life in Media	Jan 4, 2018	Image RetrievalOptical Character Recognition	—Unverified
Text Extraction From Texture Images Using Masked Signal Decomposition	Jun 11, 2017	Autonomous DrivingOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 27 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified