Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1209 papers

Title	Date	Tasks	Status
Arabic Character Segmentation Using Projection Based Approach with Profile's Amplitude Filter	Jul 4, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Arabic Handwritten Document OCR Solution with Binarization and Adaptive Scale Fusion Detection	Dec 2, 2024	BinarizationOptical Character Recognition (OCR)	—Unverified
A random forest system combination approach for error detection in digital dictionaries	Oct 30, 2014	Language ModelingLanguage Modelling	—Unverified
Artificial Eye for the Blind	Jul 7, 2023	Objectobject-detection	—Unverified
Artificial neural networks and fuzzy logic for recognizing alphabet characters and mathematical symbols	Jul 6, 2016	Image SegmentationOptical Character Recognition	—Unverified
A Scalable Handwritten Text Recognition System	Apr 19, 2019	Handwriting RecognitionHandwritten Text Recognition	—Unverified
A second-order orientation-contrast stimulus for population-receptive-field-based retinotopic mapping	Jul 10, 2017	Optical Character Recognition (OCR)	—Unverified
A semi-automatic method for document classification in the shipping industry	Mar 29, 2023	ClassificationDocument Classification	—Unverified
A Simple and Practical Approach to Improve Misspellings in OCR Text	Jun 22, 2021	Optical Character Recognition (OCR)	—Unverified
A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Multi-Task Learning	Aug 15, 2019	Multi-Task LearningOptical Character Recognition (OCR)	—Unverified
Asking questions on handwritten document collections	Oct 2, 2021	Optical Character Recognition (OCR)Question Answering	—Unverified
A Study of Sindhi Related and Arabic Script Adapted languages Recognition	Dec 13, 2014	ArticlesOptical Character Recognition	—Unverified
A survey of modern optical character recognition techniques	Dec 13, 2014	Image EnhancementOptical Character Recognition	—Unverified
A Survey on Deep learning based Document Image Enhancement	Dec 6, 2021	ArticlesBinarization	—Unverified
A Survey on MLLM-based Visually Rich Document Understanding: Methods, Challenges, and Emerging Trends	Jul 14, 2025	document understandingOptical Character Recognition	—Unverified
A Survey on Multimodal Large Language Models	Jun 23, 2023	HallucinationIn-Context Learning	—Unverified
A Survey on Optical Character Recognition System	Oct 3, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Survey on Vietnamese Document Analysis and Recognition: Challenges and Future Directions	Jun 5, 2025	Computational Efficiencydocument understanding	—Unverified
A System for Identifying and Exploring Text Repetition in Large Historical Document Corpora	May 1, 2017	Optical Character Recognition (OCR)	—Unverified
Attacking Optical Character Recognition (OCR) Systems with Adversarial Watermarks	Feb 8, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Autocorrection of arabic common errors for large text corpus	Oct 1, 2014	Morphological AnalysisOptical Character Recognition (OCR)	—Unverified
Neural Probabilistic System for Text Recognition	Dec 10, 2018	Optical Character Recognition (OCR)	—Unverified
Automated data extraction of bar chart raster images	Nov 9, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Automated Error Detection in Digitized Cultural Heritage Documents	Apr 1, 2014	Optical Character Recognition (OCR)Spelling Correction	—Unverified
Automated Parsing of Engineering Drawings for Structured Information Extraction Using a Fine-tuned Document Understanding Transformer	May 2, 2025	document understandingHallucination	—Unverified
Automated Quality Control System for Canned Tuna Production using Artificial Vision	Oct 8, 2024	GPUOptical Character Recognition (OCR)	—Unverified
Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive	Nov 2, 2020	HTROptical Character Recognition (OCR)	—Unverified
Automated Translation of a Literary Work: A Pilot Study	Jun 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Automatic Classification of Pathology Reports using TF-IDF Features	Mar 5, 2019	ClassificationDiagnostic	—Unverified
Automatic Compositor Attribution in the First Folio of Shakespeare	Apr 25, 2017	ClusteringOptical Character Recognition (OCR)	—Unverified
Auto-ML Deep Learning for Rashi Scripts OCR	Nov 3, 2018	AutoMLDeep Learning	—Unverified
Balanced Korean Word Spacing with Structural SVM	Oct 1, 2014	Information RetrievalMorphological Analysis	—Unverified
Bambara and Maninka Manding Languages Written Corpora Project (``Projet des corpus \'ecrits des langues manding : le bambara, le maninka'') [in French]	Jul 1, 2014	Optical Character Recognition (OCR)	—Unverified
Bangla Natural Language Processing: A Comprehensive Analysis of Classical, Machine Learning, and Deep Learning Based Methods	May 31, 2021	ArticlesBIG-bench Machine Learning	—Unverified
Bangla Text Recognition from Video Sequence: A New Focus	Jan 6, 2014	BinarizationOptical Character Recognition (OCR)	—Unverified
BART for Post-Correction of OCR Newspaper Text	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified
@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology	Sep 21, 2024	BenchmarkingDepth Estimation	—Unverified
Benchmark for License Plate Character Segmentation	Jul 11, 2016	License Plate DetectionLicense Plate Recognition	—Unverified
Benchmarking Algorithms for Automatic License Plate Recognition	Mar 27, 2022	BenchmarkingLicense Plate Recognition	—Unverified
Bengali Document Layout Analysis -- A YOLOV8 Based Ensembling Approach	Sep 2, 2023	Data AugmentationDocument Layout Analysis	—Unverified
Bengali Document Layout Analysis with Detectron2	Aug 26, 2023	Data AugmentationDocument Layout Analysis	—Unverified
Bengali Handwritten Digit Recognition using CNN with Explainable AI	Dec 23, 2022	Explainable Artificial Intelligence (XAI)Handwritten Digit Recognition	—Unverified
BennettNLP at SemEval-2020 Task 8: Multimodal sentiment classification Using Hybrid Hierarchical Classifier	Dec 1, 2020	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified
Between History and Natural Language Processing: Study, Enrichment and Online Publication of French Parliamentary Debates of the Early Third Republic (1881-1899)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs	Nov 28, 2024	AttributeHallucination	—Unverified
Beyond the Mud: Datasets and Benchmarks for Computer Vision in Off-Road Racing	Feb 12, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Bidirectional Trained Tree-Structured Decoder for Handwritten Mathematical Expression Recognition	Dec 31, 2023	DecoderLanguage Modeling	—Unverified
BIOfid Dataset: Publishing a German Gold Standard for Named Entity Recognition in Historical Biodiversity Literature	Nov 1, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified
BLPnet: A new DNN model and Bengali OCR engine for Automatic License Plate Recognition	Feb 18, 2022	License Plate RecognitionManagement	—Unverified
Modelling Lips-State Detection Using CNN for Non-Verbal Communications	Dec 9, 2021	License Plate DetectionLicense Plate Recognition	—Unverified

Show:10 25 50

← PrevPage 18 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified