Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 876–900 of 1209 papers

Title	Date	Tasks	Status
Automated Quality Control System for Canned Tuna Production using Artificial Vision	Oct 8, 2024	GPUOptical Character Recognition (OCR)	—Unverified
Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive	Nov 2, 2020	HTROptical Character Recognition (OCR)	—Unverified
Automated Translation of a Literary Work: A Pilot Study	Jun 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Automatic Classification of Pathology Reports using TF-IDF Features	Mar 5, 2019	ClassificationDiagnostic	—Unverified
Automatic Compositor Attribution in the First Folio of Shakespeare	Apr 25, 2017	ClusteringOptical Character Recognition (OCR)	—Unverified
Auto-ML Deep Learning for Rashi Scripts OCR	Nov 3, 2018	AutoMLDeep Learning	—Unverified
Balanced Korean Word Spacing with Structural SVM	Oct 1, 2014	Information RetrievalMorphological Analysis	—Unverified
Bambara and Maninka Manding Languages Written Corpora Project (``Projet des corpus \'ecrits des langues manding : le bambara, le maninka'') [in French]	Jul 1, 2014	Optical Character Recognition (OCR)	—Unverified
Bangla Natural Language Processing: A Comprehensive Analysis of Classical, Machine Learning, and Deep Learning Based Methods	May 31, 2021	ArticlesBIG-bench Machine Learning	—Unverified
Bangla Text Recognition from Video Sequence: A New Focus	Jan 6, 2014	BinarizationOptical Character Recognition (OCR)	—Unverified
BART for Post-Correction of OCR Newspaper Text	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified
@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology	Sep 21, 2024	BenchmarkingDepth Estimation	—Unverified
Benchmark for License Plate Character Segmentation	Jul 11, 2016	License Plate DetectionLicense Plate Recognition	—Unverified
Benchmarking Algorithms for Automatic License Plate Recognition	Mar 27, 2022	BenchmarkingLicense Plate Recognition	—Unverified
Bengali Document Layout Analysis -- A YOLOV8 Based Ensembling Approach	Sep 2, 2023	Data AugmentationDocument Layout Analysis	—Unverified
Bengali Document Layout Analysis with Detectron2	Aug 26, 2023	Data AugmentationDocument Layout Analysis	—Unverified
Bengali Handwritten Digit Recognition using CNN with Explainable AI	Dec 23, 2022	Explainable Artificial Intelligence (XAI)Handwritten Digit Recognition	—Unverified
BennettNLP at SemEval-2020 Task 8: Multimodal sentiment classification Using Hybrid Hierarchical Classifier	Dec 1, 2020	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified
Between History and Natural Language Processing: Study, Enrichment and Online Publication of French Parliamentary Debates of the Early Third Republic (1881-1899)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs	Nov 28, 2024	AttributeHallucination	—Unverified
Beyond the Mud: Datasets and Benchmarks for Computer Vision in Off-Road Racing	Feb 12, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Bidirectional Trained Tree-Structured Decoder for Handwritten Mathematical Expression Recognition	Dec 31, 2023	DecoderLanguage Modeling	—Unverified
BIOfid Dataset: Publishing a German Gold Standard for Named Entity Recognition in Historical Biodiversity Literature	Nov 1, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified
BLPnet: A new DNN model and Bengali OCR engine for Automatic License Plate Recognition	Feb 18, 2022	License Plate RecognitionManagement	—Unverified
Modelling Lips-State Detection Using CNN for Non-Verbal Communications	Dec 9, 2021	License Plate DetectionLicense Plate Recognition	—Unverified

Show:10 25 50

← PrevPage 36 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified