Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1209 papers

Title	Date	Tasks	Status	Hype
Chinese Text in the Wild	Feb 28, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
Improving OCR Accuracy on Early Printed Books by combining Pretraining, Voting, and Active Learning	Feb 27, 2018	Active LearningOptical Character Recognition (OCR)	CodeCode Available	0
Improving OCR Accuracy on Early Printed Books using Deep Convolutional Networks	Feb 27, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
A Robust Real-Time Automatic License Plate Recognition Based on the YOLO Detector	Feb 26, 2018	Data AugmentationLicense Plate Detection	CodeCode Available	1
Fooling OCR Systems with Adversarial Text Images	Feb 15, 2018	Adversarial TextOptical Character Recognition	—Unverified	0
Teaching Machines to Code: Neural Markup Generation with Visual Attention	Feb 15, 2018	MathOptical Character Recognition (OCR)	CodeCode Available	0
E2E-MLT - an Unconstrained End-to-End Method for Multi-Language Scene Text	Jan 30, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
Text Extraction and Retrieval from Smartphone Screenshots: Building a Repository for Life in Media	Jan 4, 2018	Image RetrievalOptical Character Recognition	—Unverified	0
A Novel Approach to Skew-Detection and Correction of English Alphabets for OCR	Jan 2, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Transfer Learning for OCRopus Model Training on Early Printed Books	Dec 15, 2017	Optical Character Recognition (OCR)Transfer Learning	CodeCode Available	0
SEE: Towards Semi-SupervisedEnd-to-End Scene Text Recognition	Dec 14, 2017	Optical Character Recognition (OCR)Scene Text Detection	—Unverified	0
Overview of the 2017 ALTA Shared Task: Correcting OCR Errors	Dec 1, 2017	Optical Character Recognition (OCR)	—Unverified	0
OCR Post-Processing Text Correction using Simulated Annealing (OPTeCA)	Dec 1, 2017	Feature EngineeringOptical Character Recognition (OCR)	—Unverified	0
SuperOCR for ALTA 2017 Shared Task	Dec 1, 2017	Language ModelingLanguage Modelling	—Unverified	0
Gated Recurrent Convolution Neural Network for OCR	Dec 1, 2017	General Classificationimage-classification	CodeCode Available	0
Improving OCR Accuracy on Early Printed Books by utilizing Cross Fold Training and Voting	Nov 27, 2017	Optical Character Recognition (OCR)	CodeCode Available	0
Optical Character Recognition (OCR) for Telugu: Database, Algorithm and Application	Nov 20, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
CryptoDL: Deep Neural Networks over Encrypted Data	Nov 14, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
AON: Towards Arbitrarily-Oriented Text Recognition	Nov 12, 2017	DecoderOptical Character Recognition	CodeCode Available	0
Generating a Training Corpus for OCR Post-Correction Using Encoder-Decoder Model	Nov 1, 2017	DecoderLanguage Modeling	—Unverified	0
Page Stream Segmentation with Convolutional Neural Nets Combining Textual and Visual Features	Oct 9, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Linear-Time Sequence Classification using Restricted Boltzmann Machines	Oct 6, 2017	ChunkingClassification	—Unverified	0
A Survey on Optical Character Recognition System	Oct 3, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Diachronic Corpus for Romanian (RoDia)	Sep 1, 2017	Information RetrievalOptical Character Recognition (OCR)	—Unverified	0
Transliterated Mobile Keyboard Input via Weighted Finite-State Transducers	Sep 1, 2017	Language ModelingLanguage Modelling	—Unverified	0
Improving Document Clustering by Removing Unnatural Language	Sep 1, 2017	ClusteringDocument Layout Analysis	—Unverified	0
Multi-modular domain-tailored OCR post-correction	Sep 1, 2017	DiversityMachine Translation	—Unverified	0
The Labeled Segmentation of Printed Books	Sep 1, 2017	Optical Character Recognition (OCR)Segmentation	—Unverified	0
Word Searching in Scene Image and Video Frame in Multi-Script Scenario using Dynamic Shape Coding	Aug 18, 2017	Keyword SpottingOptical Character Recognition (OCR)	—Unverified	0
Sequence-to-Label Script Identification for Multilingual OCR	Aug 15, 2017	Optical Character Recognition (OCR)	—Unverified	0
Convolutional Neural Networks for Font Classification	Aug 11, 2017	ClassificationData Augmentation	—Unverified	0
STN-OCR: A single Neural Network for Text Detection and Text Recognition	Jul 27, 2017	Optical Character Recognition (OCR)Scene Text Detection	CodeCode Available	0
A Novel Transfer Learning Approach upon Hindi, Arabic, and Bangla Numerals using Convolutional Neural Networks	Jul 26, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Text Recognition in Scene Image and Video Frame using Color Channel Selection	Jul 21, 2017	Binarizationchannel selection	—Unverified	0
A second-order orientation-contrast stimulus for population-receptive-field-based retinotopic mapping	Jul 10, 2017	Optical Character Recognition (OCR)	—Unverified	0
Arabic Character Segmentation Using Projection Based Approach with Profile's Amplitude Filter	Jul 4, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Single Classifier-based Passive System for Source Printer Classification using Local Texture Features	Jun 22, 2017	General ClassificationOptical Character Recognition (OCR)	CodeCode Available	0
SEARNN: Training RNNs with Global-Local Losses	Jun 14, 2017	Machine TranslationOptical Character Recognition (OCR)	CodeCode Available	0
Text Extraction From Texture Images Using Masked Signal Decomposition	Jun 11, 2017	Autonomous DrivingOptical Character Recognition	—Unverified	0
Traitement des Mots Hors Vocabulaire pour la Traduction Automatique de Document OCRis\'es en Arabe (This article presents a new system that automatically translates images of arabic documents)	Jun 1, 2017	es-enOptical Character Recognition (OCR)	—Unverified	0
Handwritten Urdu Character Recognition using 1-Dimensional BLSTM Classifier	May 15, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Derivate-based Component-Trees for Multi-Channel Image Segmentation	May 4, 2017	Image SegmentationOptical Character Recognition (OCR)	—Unverified	0
OCR and post-correction of historical Finnish texts	May 1, 2017	Optical Character Recognition (OCR)Spelling Correction	—Unverified	0
Tagging Named Entities in 19th Century and Modern Finnish Newspaper Material with a Finnish Semantic Tagger	May 1, 2017	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified	0
Applying BLAST to Text Reuse Detection in Finnish Newspapers and Journals, 1771-1910	May 1, 2017	Optical Character Recognition (OCR)	—Unverified	0
The Making of the Royal Society Corpus	May 1, 2017	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified	0
Improving Optical Character Recognition of Finnish Historical Newspapers with a Combination of Fraktur \& Antiqua Models and Image Preprocessing	May 1, 2017	Boundary DetectionInformation Retrieval	—Unverified	0
A System for Identifying and Exploring Text Repetition in Large Historical Document Corpora	May 1, 2017	Optical Character Recognition (OCR)	—Unverified	0
Automatic Compositor Attribution in the First Folio of Shakespeare	Apr 25, 2017	ClusteringOptical Character Recognition (OCR)	—Unverified	0
Scatteract: Automated extraction of data from scatter plots	Apr 21, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 21 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified