Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1025 of 1209 papers

Title	Date	Tasks	Status	Hype
Chinese Text in the Wild	Feb 28, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
Improving OCR Accuracy on Early Printed Books by combining Pretraining, Voting, and Active Learning	Feb 27, 2018	Active LearningOptical Character Recognition (OCR)	CodeCode Available	0
Improving OCR Accuracy on Early Printed Books using Deep Convolutional Networks	Feb 27, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
A Robust Real-Time Automatic License Plate Recognition Based on the YOLO Detector	Feb 26, 2018	Data AugmentationLicense Plate Detection	CodeCode Available	1
Fooling OCR Systems with Adversarial Text Images	Feb 15, 2018	Adversarial TextOptical Character Recognition	—Unverified	0
Teaching Machines to Code: Neural Markup Generation with Visual Attention	Feb 15, 2018	MathOptical Character Recognition (OCR)	CodeCode Available	0
E2E-MLT - an Unconstrained End-to-End Method for Multi-Language Scene Text	Jan 30, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
Text Extraction and Retrieval from Smartphone Screenshots: Building a Repository for Life in Media	Jan 4, 2018	Image RetrievalOptical Character Recognition	—Unverified	0
A Novel Approach to Skew-Detection and Correction of English Alphabets for OCR	Jan 2, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Transfer Learning for OCRopus Model Training on Early Printed Books	Dec 15, 2017	Optical Character Recognition (OCR)Transfer Learning	CodeCode Available	0
SEE: Towards Semi-SupervisedEnd-to-End Scene Text Recognition	Dec 14, 2017	Optical Character Recognition (OCR)Scene Text Detection	—Unverified	0
Overview of the 2017 ALTA Shared Task: Correcting OCR Errors	Dec 1, 2017	Optical Character Recognition (OCR)	—Unverified	0
OCR Post-Processing Text Correction using Simulated Annealing (OPTeCA)	Dec 1, 2017	Feature EngineeringOptical Character Recognition (OCR)	—Unverified	0
SuperOCR for ALTA 2017 Shared Task	Dec 1, 2017	Language ModelingLanguage Modelling	—Unverified	0
Gated Recurrent Convolution Neural Network for OCR	Dec 1, 2017	General Classificationimage-classification	CodeCode Available	0
Improving OCR Accuracy on Early Printed Books by utilizing Cross Fold Training and Voting	Nov 27, 2017	Optical Character Recognition (OCR)	CodeCode Available	0
Optical Character Recognition (OCR) for Telugu: Database, Algorithm and Application	Nov 20, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
CryptoDL: Deep Neural Networks over Encrypted Data	Nov 14, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
AON: Towards Arbitrarily-Oriented Text Recognition	Nov 12, 2017	DecoderOptical Character Recognition	CodeCode Available	0
Generating a Training Corpus for OCR Post-Correction Using Encoder-Decoder Model	Nov 1, 2017	DecoderLanguage Modeling	—Unverified	0
Page Stream Segmentation with Convolutional Neural Nets Combining Textual and Visual Features	Oct 9, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Linear-Time Sequence Classification using Restricted Boltzmann Machines	Oct 6, 2017	ChunkingClassification	—Unverified	0
A Survey on Optical Character Recognition System	Oct 3, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Diachronic Corpus for Romanian (RoDia)	Sep 1, 2017	Information RetrievalOptical Character Recognition (OCR)	—Unverified	0
Transliterated Mobile Keyboard Input via Weighted Finite-State Transducers	Sep 1, 2017	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 41 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified