Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1209 papers

Title	Date	Tasks	Status
A Multi-faceted OCR Framework for Artificial Urdu News Ticker Text Recognition	Apr 24, 2018	Optical Character Recognition (OCR)Retrieval	—Unverified
French Word Recognition through a Quick Survey on Recurrent Neural Networks Using Long-Short Term Memory RNN-LSTM	Apr 10, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
The Monge-Kantorovich Optimal Transport Distance for Image Comparison	Apr 8, 2018	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Neural Monkey: The Current State and Beyond	Mar 1, 2018	Image CaptioningMachine Translation	—Unverified
Chinese Text in the Wild	Feb 28, 2018	Optical Character Recognition (OCR)	CodeCode Available
Improving OCR Accuracy on Early Printed Books using Deep Convolutional Networks	Feb 27, 2018	Optical Character Recognition (OCR)	CodeCode Available
Improving OCR Accuracy on Early Printed Books by combining Pretraining, Voting, and Active Learning	Feb 27, 2018	Active LearningOptical Character Recognition (OCR)	CodeCode Available
Fooling OCR Systems with Adversarial Text Images	Feb 15, 2018	Adversarial TextOptical Character Recognition	—Unverified
Teaching Machines to Code: Neural Markup Generation with Visual Attention	Feb 15, 2018	MathOptical Character Recognition (OCR)	CodeCode Available
E2E-MLT - an Unconstrained End-to-End Method for Multi-Language Scene Text	Jan 30, 2018	Optical Character Recognition (OCR)	CodeCode Available
Text Extraction and Retrieval from Smartphone Screenshots: Building a Repository for Life in Media	Jan 4, 2018	Image RetrievalOptical Character Recognition	—Unverified
A Novel Approach to Skew-Detection and Correction of English Alphabets for OCR	Jan 2, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Transfer Learning for OCRopus Model Training on Early Printed Books	Dec 15, 2017	Optical Character Recognition (OCR)Transfer Learning	CodeCode Available
SEE: Towards Semi-SupervisedEnd-to-End Scene Text Recognition	Dec 14, 2017	Optical Character Recognition (OCR)Scene Text Detection	—Unverified
Overview of the 2017 ALTA Shared Task: Correcting OCR Errors	Dec 1, 2017	Optical Character Recognition (OCR)	—Unverified
Gated Recurrent Convolution Neural Network for OCR	Dec 1, 2017	General Classificationimage-classification	CodeCode Available
SuperOCR for ALTA 2017 Shared Task	Dec 1, 2017	Language ModelingLanguage Modelling	—Unverified
OCR Post-Processing Text Correction using Simulated Annealing (OPTeCA)	Dec 1, 2017	Feature EngineeringOptical Character Recognition (OCR)	—Unverified
Improving OCR Accuracy on Early Printed Books by utilizing Cross Fold Training and Voting	Nov 27, 2017	Optical Character Recognition (OCR)	CodeCode Available
Optical Character Recognition (OCR) for Telugu: Database, Algorithm and Application	Nov 20, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CryptoDL: Deep Neural Networks over Encrypted Data	Nov 14, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
AON: Towards Arbitrarily-Oriented Text Recognition	Nov 12, 2017	DecoderOptical Character Recognition	CodeCode Available
Generating a Training Corpus for OCR Post-Correction Using Encoder-Decoder Model	Nov 1, 2017	DecoderLanguage Modeling	—Unverified
Page Stream Segmentation with Convolutional Neural Nets Combining Textual and Visual Features	Oct 9, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Linear-Time Sequence Classification using Restricted Boltzmann Machines	Oct 6, 2017	ChunkingClassification	—Unverified
A Survey on Optical Character Recognition System	Oct 3, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Diachronic Corpus for Romanian (RoDia)	Sep 1, 2017	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Multi-modular domain-tailored OCR post-correction	Sep 1, 2017	DiversityMachine Translation	—Unverified
Improving Document Clustering by Removing Unnatural Language	Sep 1, 2017	ClusteringDocument Layout Analysis	—Unverified
Transliterated Mobile Keyboard Input via Weighted Finite-State Transducers	Sep 1, 2017	Language ModelingLanguage Modelling	—Unverified
The Labeled Segmentation of Printed Books	Sep 1, 2017	Optical Character Recognition (OCR)Segmentation	—Unverified
Word Searching in Scene Image and Video Frame in Multi-Script Scenario using Dynamic Shape Coding	Aug 18, 2017	Keyword SpottingOptical Character Recognition (OCR)	—Unverified
Sequence-to-Label Script Identification for Multilingual OCR	Aug 15, 2017	Optical Character Recognition (OCR)	—Unverified
Convolutional Neural Networks for Font Classification	Aug 11, 2017	ClassificationData Augmentation	—Unverified
STN-OCR: A single Neural Network for Text Detection and Text Recognition	Jul 27, 2017	Optical Character Recognition (OCR)Scene Text Detection	CodeCode Available
A Novel Transfer Learning Approach upon Hindi, Arabic, and Bangla Numerals using Convolutional Neural Networks	Jul 26, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Text Recognition in Scene Image and Video Frame using Color Channel Selection	Jul 21, 2017	Binarizationchannel selection	—Unverified
A second-order orientation-contrast stimulus for population-receptive-field-based retinotopic mapping	Jul 10, 2017	Optical Character Recognition (OCR)	—Unverified
Arabic Character Segmentation Using Projection Based Approach with Profile's Amplitude Filter	Jul 4, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Single Classifier-based Passive System for Source Printer Classification using Local Texture Features	Jun 22, 2017	General ClassificationOptical Character Recognition (OCR)	CodeCode Available
SEARNN: Training RNNs with Global-Local Losses	Jun 14, 2017	Machine TranslationOptical Character Recognition (OCR)	CodeCode Available
Text Extraction From Texture Images Using Masked Signal Decomposition	Jun 11, 2017	Autonomous DrivingOptical Character Recognition	—Unverified
Traitement des Mots Hors Vocabulaire pour la Traduction Automatique de Document OCRis\'es en Arabe (This article presents a new system that automatically translates images of arabic documents)	Jun 1, 2017	es-enOptical Character Recognition (OCR)	—Unverified
Handwritten Urdu Character Recognition using 1-Dimensional BLSTM Classifier	May 15, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Derivate-based Component-Trees for Multi-Channel Image Segmentation	May 4, 2017	Image SegmentationOptical Character Recognition (OCR)	—Unverified
The Making of the Royal Society Corpus	May 1, 2017	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
Tagging Named Entities in 19th Century and Modern Finnish Newspaper Material with a Finnish Semantic Tagger	May 1, 2017	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified
OCR and post-correction of historical Finnish texts	May 1, 2017	Optical Character Recognition (OCR)Spelling Correction	—Unverified
Improving Optical Character Recognition of Finnish Historical Newspapers with a Combination of Fraktur \& Antiqua Models and Image Preprocessing	May 1, 2017	Boundary DetectionInformation Retrieval	—Unverified
Applying BLAST to Text Reuse Detection in Finnish Newspapers and Journals, 1771-1910	May 1, 2017	Optical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 21 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified