Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 1209 papers

Title	Date	Tasks	Status	Hype
Noisy Parallel Data Alignment	Jan 23, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
On the feasibility of attacking Thai LPR systems with adversarial examples	Jan 13, 2023	Adversarial AttackLicense Plate Recognition	—Unverified	0
Improving Inference Performance of Machine Learning with the Divide-and-Conquer Principle	Jan 12, 2023	CPUOptical Character Recognition	—Unverified	0
Semantic rule Web-based Diagnosis and Treatment of Vector-Borne Diseases using SWRL rules	Jan 8, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
IMKGA-SM: Interpretable Multimodal Knowledge Graph Answer Prediction via Sequence Modeling	Jan 6, 2023	Link PredictionOptical Character Recognition	CodeCode Available	2
A Comprehensive Gold Standard and Benchmark for Comics Text Detection and Recognition	Dec 27, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Bengali Handwritten Digit Recognition using CNN with Explainable AI	Dec 23, 2022	Explainable Artificial Intelligence (XAI)Handwritten Digit Recognition	—Unverified	0
Wukong-Reader: Multi-modal Pre-training for Fine-grained Visual Document Understanding	Dec 19, 2022	Contrastive Learningdocument understanding	CodeCode Available	0
Transferring General Multimodal Pretrained Models to Text Recognition	Dec 19, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified	0
Towards Robust Handwritten Text Recognition with On-the-fly User Participation	Dec 17, 2022	Handwritten Text RecognitionOptical Character Recognition (OCR)	—Unverified	0
Geometric Rectification of Creased Document Images based on Isometric Mapping	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
SceneGATE: Scene-Graph based co-Attention networks for TExt visual question answering	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images	Dec 16, 2022	DecoderOptical Character Recognition (OCR)	CodeCode Available	0
Extending TrOCR for Text Localization-Free OCR of Full-Page Scanned Receipt Images	Dec 11, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
PACMAN: a framework for pulse oximeter digit detection and reading in a low-resource setting	Dec 9, 2022	object-detectionObject Detection	—Unverified	0
OCR-RTPS: An OCR-based real-time positioning system for the valet parking	Dec 8, 2022	Autonomous DrivingOptical Character Recognition (OCR)	—Unverified	0
SoftCTC -- Semi-Supervised Learning for Text Recognition using Soft Pseudo-Labels	Dec 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Information Retrieval from the Digitized Books	Dec 2, 2022	Image RetrievalInformation Retrieval	—Unverified	0
Chart-RCNN: Efficient Line Chart Data Extraction from Camera Images	Nov 25, 2022	object-detectionObject Detection	—Unverified	0
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified	0
Out-of-Candidate Rectification for Weakly Supervised Semantic Segmentation	Nov 22, 2022	Optical Character Recognition (OCR)Semantic Segmentation	—Unverified	0
Let's Enhance: A Deep Learning Approach to Extreme Deblurring of Text Images	Nov 18, 2022	DeblurringImage Deblurring	CodeCode Available	1
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
ChartParser: Automatic Chart Parsing for Print-Impaired	Nov 16, 2022	Optical Character Recognition (OCR)	—Unverified	0
NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision Research	Nov 15, 2022	Continual LearningDiversity	CodeCode Available	1

Show:10 25 50

← PrevPage 21 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified