Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 1209 papers

Title	Date	Tasks	Status
DECDM: Document Enhancement using Cycle-Consistent Diffusion Models	Nov 16, 2023	Data AugmentationDenoising	—Unverified
Decoding Anagrammed Texts Written in an Unknown Language and Script	Jan 1, 2016	DeciphermentLanguage Identification	—Unverified
Artificial Eye for the Blind	Jul 7, 2023	Objectobject-detection	—Unverified
Classroom Slide Narration System	Jan 21, 2022	Image SegmentationOptical Character Recognition	—Unverified
Data Cleaning for XML Electronic Dictionaries via Statistical Anomaly Detection	Feb 25, 2016	Anomaly DetectionOptical Character Recognition	—Unverified
Classification of Contract-Amendment Relationships	Jun 8, 2021	ClassificationManagement	—Unverified
Chunk-based Chinese Spelling Check with Global Optimization	Nov 1, 2020	global-optimizationOptical Character Recognition	—Unverified
DanProof: Pedagogical Spell and Grammar Checking for Danish	Sep 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding	Jul 14, 2022	document understandingOptical Character Recognition (OCR)	—Unverified
Deductron -- A Recurrent Neural Network	Jun 23, 2018	Image to textOptical Character Recognition (OCR)	—Unverified
CHISPA on the GO: A mobile Chinese-Spanish translation service for travellers in trouble	Apr 1, 2014	Image RetrievalInformation Retrieval	—Unverified
CREPE: Coordinate-Aware End-to-End Document Parser	May 1, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Chinese/English mixed Character Segmentation as Semantic Segmentation	Nov 7, 2016	DiversityOptical Character Recognition (OCR)	—Unverified
A random forest system combination approach for error detection in digital dictionaries	Oct 30, 2014	Language ModelingLanguage Modelling	—Unverified
A Linked Data Model for Multimodal Sentiment and Emotion Analysis	Jul 1, 2015	Emotion RecognitionOpinion Mining	—Unverified
Crowdsourcing an OCR Gold Standard for a German and French Heritage Corpus	May 1, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Classification of Documents Extracted from Images with Optical Character Recognition Methods	Jun 15, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified
ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints	May 8, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Masked Bounding-Box Selection Based ResNet Predictor for Text Rotation Prediction	Sep 6, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Cleansing Jewel: A Neural Spelling Correction Model Built On Google OCR-ed Tibetan Manuscripts	Apr 7, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Arabic Handwritten Document OCR Solution with Binarization and Adaptive Scale Fusion Detection	Dec 2, 2024	BinarizationOptical Character Recognition (OCR)	—Unverified
CLIP is Almost All You Need: Towards Parameter-Efficient Scene Text Retrieval without OCR	Jan 1, 2025	AllOptical Character Recognition	—Unverified
CLIP-ReIdent: Contrastive Training for Player Re-Identification	Mar 21, 2023	Optical Character Recognition (OCR)Sports Analytics	—Unverified
A Scalable Handwritten Text Recognition System	Apr 19, 2019	Handwriting RecognitionHandwritten Text Recognition	—Unverified
Chaurah: A Smart Raspberry Pi based Parking System	Dec 28, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 10 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified