Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1209 papers

Title	Date	Tasks	Status
Combining OCR Outputs for Logical Document Structure Markup. Technical Background to the ACL 2012 Contributed Task	Jul 1, 2012	Optical Character Recognition (OCR)	—Unverified
Combining Phonology and Morphology for the Normalization of Historical Texts	Aug 1, 2016	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Comparing human versus automatic feature extraction for fine-grained elementary readability assessment	Jun 1, 2012	Optical Character Recognition (OCR)Text Simplification	—Unverified
Comparison of Image Preprocessing Techniques for Vehicle License Plate Recognition Using OCR: Performance and Accuracy Evaluation	Oct 15, 2024	License Plate RecognitionOptical Character Recognition	—Unverified
Comparison of Visual and Logical Character Segmentation in Tesseract OCR Language Data for Indic Writing Scripts	Dec 1, 2015	Optical Character Recognition (OCR)	—Unverified
Comprehensive Overview of Named Entity Recognition: Models, Domain-Specific Applications and Challenges	Sep 25, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
Computer-assisted Speaker Diarization: How to Evaluate Human Corrections	May 1, 2018	Active LearningFace Recognition	—Unverified
Computer vision based vehicle tracking as a complementary and scalable approach to RFID tagging	Sep 13, 2022	object-detectionObject Detection	—Unverified
Computer Vision Intelligence Test Modeling and Generation: A Case Study on Smart OCR	Sep 14, 2024	3D ClassificationOptical Character Recognition	—Unverified
Computer Vision Toolkit for Non-invasive Monitoring of Factory Floor Artifacts	May 12, 2020	Anomaly DetectionContour Detection	—Unverified
Confidence-Aware Document OCR Error Detection	Sep 6, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Confidence Prediction for Lexicon-Free OCR	May 28, 2018	General ClassificationMulti-class Classification	—Unverified
Consensus Entropy: Harnessing Multi-VLM Agreement for Self-Verifying and Self-Improving OCR	Apr 15, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Confronting the Constraints for Optical Character Segmentation from Printed Bangla Text Image	Mar 18, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Constructing a Public Meeting Corpus	May 1, 2020	Optical Character Recognition (OCR)	—Unverified
Constructing Image-Text Pair Dataset from Books	Oct 3, 2023	Image-text RetrievalOptical Character Recognition (OCR)	—Unverified
Construction and Annotation of a French Folkstale Corpus	May 1, 2014	Emotion RecognitionInformation Retrieval	—Unverified
Content-based similar document image retrieval using fusion of CNN features	Mar 23, 2017	Image RetrievalOptical Character Recognition (OCR)	—Unverified
Context-Free TextSpotter for Real-Time and Mobile End-to-End Text Detection and Recognition	Jun 10, 2021	GPUOptical Character Recognition (OCR)	—Unverified
Context-Independent OCR with Multimodal LLMs: Effects of Image Resolution and Visual Complexity	Mar 31, 2025	Image CaptioningOptical Character Recognition	—Unverified
Contrastive Graph Multimodal Model for Text Classification in Videos	Jun 6, 2022	ClassificationContrastive Learning	—Unverified
ConvMath: A Convolutional Sequence Network for Mathematical Expression Recognition	Dec 23, 2020	DecoderOptical Character Recognition	—Unverified
Convolutional Neural Networks for Automatic Meter Reading	Feb 25, 2019	Counter RecognitionData Augmentation	—Unverified
Convolutional Neural Networks for Font Classification	Aug 11, 2017	ClassificationData Augmentation	—Unverified
CorA: A web-based annotation tool for historical and other non-standard language data	Apr 1, 2014	Optical Character Recognition (OCR)	—Unverified
Corporate IT-support Help-Desk Process Hybrid-Automation Solution with Machine Learning Approach	Sep 18, 2019	BIG-bench Machine LearningOptical Character Recognition (OCR)	—Unverified
Corpus of 19th-century Czech Texts: Problems and Solutions	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods	May 1, 2018	ArticlesGrammatical Error Correction	—Unverified
Corrupted but Not Broken: Understanding and Mitigating the Negative Impacts of Corrupted Data in Visual Instruction Tuning	Feb 18, 2025	Optical Character Recognition (OCR)	—Unverified
CREPE: Coordinate-Aware End-to-End Document Parser	May 1, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Crowdsourcing an OCR Gold Standard for a German and French Heritage Corpus	May 1, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CryptoDL: Deep Neural Networks over Encrypted Data	Nov 14, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CSECU\_KDE\_MA at SemEval-2020 Task 8: A Neural Attention Model for Memotion Analysis	Dec 1, 2020	Optical Character Recognition (OCR)	—Unverified
DanProof: Pedagogical Spell and Grammar Checking for Danish	Sep 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Data Cleaning for XML Electronic Dictionaries via Statistical Anomaly Detection	Feb 25, 2016	Anomaly DetectionOptical Character Recognition	—Unverified
DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding	Jul 14, 2022	document understandingOptical Character Recognition (OCR)	—Unverified
DECDM: Document Enhancement using Cycle-Consistent Diffusion Models	Nov 16, 2023	Data AugmentationDenoising	—Unverified
Decoding Anagrammed Texts Written in an Unknown Language and Script	Jan 1, 2016	DeciphermentLanguage Identification	—Unverified
Deductron -- A Recurrent Neural Network	Jun 23, 2018	Image to textOptical Character Recognition (OCR)	—Unverified
Deep Learning Approach for Receipt Recognition	May 30, 2019	DecoderDeep Learning	—Unverified
Deep learning-based NLP Data Pipeline for EHR Scanned Document Information Extraction	Sep 14, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Deep Learning Based Traffic Surveillance System For Missing and Suspicious Car Detection	Jul 17, 2020	Generative Adversarial NetworkOptical Character Recognition	—Unverified
Deep Learning Based Vehicle Tracking System Using License Plate Detection And Recognition	May 10, 2020	GPULicense Plate Detection	—Unverified
Deep Reader: Information extraction from Document images via relation extraction and Natural Language	Dec 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Deep Structured Feature Networks for Table Detection and Tabular Data Extraction from Scanned Financial Document Images	Feb 20, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Delta vs. N-Gram Tracing: Evaluating the Robustness of Authorship Attribution Methods	May 1, 2018	Authorship AttributionOptical Character Recognition (OCR)	—Unverified
Derivate-based Component-Trees for Multi-Channel Image Segmentation	May 4, 2017	Image SegmentationOptical Character Recognition (OCR)	—Unverified
Design and Development of a Framework For Stroke-Based Handwritten Gujarati Font Generation	Apr 4, 2024	Font GenerationOptical Character Recognition (OCR)	—Unverified
Design and Implementation of an OCR-Powered Pipeline for Table Extraction from Invoices	Jul 9, 2025	Boundary DetectionOptical Character Recognition (OCR)	—Unverified
Detecting de minimis Code-Switching in Historical German Books	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 20 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified