Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 526–550 of 1209 papers

Title	Date	Tasks	Status	Hype
A Benchmark and Dataset for Post-OCR text correction in Sanskrit	Nov 15, 2022	AstronomyOptical Character Recognition (OCR)	CodeCode Available	1
On Web-based Visual Corpus Construction for Visual Document Understanding	Nov 7, 2022	document understandingOptical Character Recognition (OCR)	CodeCode Available	1
Unsupervised Audio-Visual Lecture Segmentation	Oct 29, 2022	NavigateOptical Character Recognition (OCR)	CodeCode Available	1
Efficient few-shot learning for pixel-precise handwritten document layout analysis	Oct 27, 2022	Document Layout AnalysisFew-Shot Learning	—Unverified	0
A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail	Oct 26, 2022	CPUOptical Character Recognition	—Unverified	0
MCSCSet: A Specialist-annotated Dataset for Medical-domain Chinese Spelling Correction	Oct 21, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
OCR-VQGAN: Taming Text-within-Image Generation	Oct 19, 2022	ArticlesDecoder	CodeCode Available	1
MenuAI: Restaurant Food Recommendation System via a Transformer-based Deep Learning Model	Oct 15, 2022	Food recommendationLearning-To-Rank	—Unverified	0
Text Detection Forgot About Document OCR	Oct 14, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	2
Task Grouping for Multilingual Text Recognition	Oct 13, 2022	Optical Character Recognition (OCR)	CodeCode Available	1
Pix2Struct: Screenshot Parsing as Pretraining for Visual Language Understanding	Oct 7, 2022	Chart Question AnsweringDiversity	CodeCode Available	2
Key Information Extraction in Purchase Documents using Deep Learning and Rule-based Corrections	Oct 7, 2022	Key Information ExtractionLine Detection	—Unverified	0
EraseNet: A Recurrent Residual Network for Supervised Document Cleaning	Oct 3, 2022	DenoisingOptical Character Recognition	—Unverified	0
Chandojnanam: A Sanskrit Meter Identification and Utilization System	Sep 29, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Synthesizing Annotated Image and Video Data Using a Rendering-Based Pipeline for Improved License Plate Recognition	Sep 28, 2022	Data AugmentationLicense Plate Recognition	—Unverified	0
3D Rendering Framework for Data Augmentation in Optical Character Recognition	Sep 27, 2022	Data AugmentationOptical Character Recognition	—Unverified	0
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering	Sep 21, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified	0
HAPI: A Large-scale Longitudinal Dataset of Commercial ML API Predictions	Sep 18, 2022	object-detectionObject Detection	CodeCode Available	1
Out-of-Vocabulary Challenge Report	Sep 14, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
OCR for TIFF Compressed Document Images Directly in Compressed Domain Using Text segmentation and Hidden Markov Model	Sep 13, 2022	Optical Character Recognition (OCR)Text Segmentation	—Unverified	0
Document Image Binarization in JPEG Compressed Domain using Dual Discriminator Generative Adversarial Networks	Sep 13, 2022	BinarizationOptical Character Recognition (OCR)	—Unverified	0
Computer vision based vehicle tracking as a complementary and scalable approach to RFID tagging	Sep 13, 2022	object-detectionObject Detection	—Unverified	0
PreSTU: Pre-Training for Scene-Text Understanding	Sep 12, 2022	DecoderImage Captioning	—Unverified	0
Multi-Granularity Prediction for Scene Text Recognition	Sep 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	0
Levenshtein OCR	Sep 8, 2022	Imitation LearningOptical Character Recognition (OCR)	CodeCode Available	0

Show:10 25 50

← PrevPage 22 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified