Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1209 papers

Title	Date	Tasks	Status	Hype
Neural Probabilistic System for Text Recognition	Dec 10, 2018	Optical Character Recognition (OCR)	—Unverified	0
Binary Document Image Super Resolution for Improved Readability and OCR Performance	Dec 6, 2018	Image Super-ResolutionInformation Retrieval	CodeCode Available	0
Extracting structured data from invoices	Dec 1, 2018	BIG-bench Machine LearningOptical Character Recognition (OCR)	—Unverified	0
A Compositional Textual Model for Recognition of Imperfect Word Images	Nov 27, 2018	Optical Character Recognition (OCR)Printed Text Recognition	—Unverified	0
Survey of Computational Approaches to Lexical Semantic Change	Nov 15, 2018	Change DetectionInformation Retrieval	—Unverified	0
From Videos to URLs: A Multi-Browser Guide To Extract User's Behavior with Optical Character Recognition	Nov 15, 2018	MarketingOptical Character Recognition	CodeCode Available	0
Auto-ML Deep Learning for Rashi Scripts OCR	Nov 3, 2018	AutoMLDeep Learning	—Unverified	0
Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition	Nov 2, 2018	DecoderIrregular Text Recognition	CodeCode Available	1
Combining Human and Machine Transcriptions on the Zooniverse Platform	Nov 1, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Resolving Referring Expressions in Images With Labeled Elements	Oct 24, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Image-based Natural Language Understanding Using 2D Convolutional Neural Networks	Oct 24, 2018	ClassificationGeneral Classification	—Unverified	0
State of the Art Optical Character Recognition of 19th Century Fraktur Scripts using Open Source Engines	Oct 8, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Zero-Shot Learning Based Approach For Medieval Word Recognition Using Deep-Learned Features	Oct 1, 2018	AttributeGeneralized Zero-Shot Learning	—Unverified	0
A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check	Oct 1, 2018	Language ModelingLanguage Modelling	CodeCode Available	0
Ground Truth for training OCR engines on historical documents in German Fraktur and Early Modern Latin	Sep 14, 2018	Optical Character Recognition (OCR)	—Unverified	0
Upcycle Your OCR: Reusing OCRs for Post-OCR Text Correction in Romanised Sanskrit	Sep 6, 2018	Optical Character Recognition (OCR)	CodeCode Available	0
License Plate Detection and Recognition in Unconstrained Scenarios	Sep 1, 2018	License Plate DetectionLicense Plate Recognition	CodeCode Available	0
Indigenous language technologies in Canada: Assessment, challenges, and successes	Aug 1, 2018	Machine TranslationOptical Character Recognition	—Unverified	0
Local String Transduction as Sequence Labeling	Aug 1, 2018	LemmatizationMachine Translation	—Unverified	0
Towards an Automatic Classification of Illustrative Examples in a Large Japanese-French Dictionary Obtained by OCR	Aug 1, 2018	General ClassificationMachine Translation	—Unverified	0
CG-DIQA: No-reference Document Image Quality Assessment Based on Character Gradient	Jul 11, 2018	Document Image Quality AssessmentImage Quality Assessment	—Unverified	0
FINN-L: Library Extensions and Design Trade-off Analysis for Variable Precision LSTM Networks on FPGAs	Jul 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Sum-Product Networks for Sequence Labeling	Jul 6, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Calamari - A High-Performance Tensorflow-based Deep Learning Package for Optical Character Recognition	Jul 5, 2018	GPUOptical Character Recognition	CodeCode Available	0
Multi-Input Attention for Unsupervised OCR Correction	Jul 1, 2018	DecoderOptical Character Recognition (OCR)	—Unverified	0
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification	Jun 25, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Deductron -- A Recurrent Neural Network	Jun 23, 2018	Image to textOptical Character Recognition (OCR)	—Unverified	0
Recommending Scientific Videos based on Metadata Enrichment using Linked Open Data	Jun 19, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Recognition	Jun 4, 2018	DecoderOptical Character Recognition (OCR)	CodeCode Available	0
Confidence Prediction for Lexicon-Free OCR	May 28, 2018	General ClassificationMulti-class Classification	—Unverified	0
Implicit Language Model in LSTM for OCR	May 23, 2018	Language ModelingLanguage Modelling	CodeCode Available	0
IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Text Detection	May 3, 2018	Multi-Oriented Scene Text Detectionobject-detection	—Unverified	0
D\'etection d'erreurs dans des transcriptions OCR de documents historiques par r\'eseaux de neurones r\'ecurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)	May 1, 2018	Optical Character Recognition (OCR)	—Unverified	0
Delta vs. N-Gram Tracing: Evaluating the Robustness of Authorship Attribution Methods	May 1, 2018	Authorship AttributionOptical Character Recognition (OCR)	—Unverified	0
Low-resource Post Processing of Noisy OCR Output for Historical Corpus Digitisation	May 1, 2018	Optical Character Recognition (OCR)	—Unverified	0
TF-LM: TensorFlow-based Language Modeling Toolkit	May 1, 2018	Language ModelingLanguage Modelling	CodeCode Available	0
Building A Handwritten Cuneiform Character Imageset	May 1, 2018	Machine TranslationOptical Character Recognition (OCR)	—Unverified	0
Matics Software Suite: New Tools for Evaluation and Data Exploration	May 1, 2018	Optical Character Recognition (OCR)Speaker Diarization	—Unverified	0
Computer-assisted Speaker Diarization: How to Evaluate Human Corrections	May 1, 2018	Active LearningFace Recognition	—Unverified	0
Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods	May 1, 2018	ArticlesGrammatical Error Correction	—Unverified	0
PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents	May 1, 2018	Coreference ResolutionOptical Character Recognition (OCR)	CodeCode Available	0
Towards Processing of the Oral History Interviews and Related Printed Documents	May 1, 2018	Automatic Speech Recognition (ASR)Optical Character Recognition (OCR)	—Unverified	0
Measuring Innovation in Speech and Language Processing Publications.	May 1, 2018	Information RetrievalOptical Character Recognition (OCR)	—Unverified	0
PDF-to-Text Reanalysis for Linguistic Data Mining	May 1, 2018	Optical Character Recognition (OCR)	—Unverified	0
PDFdigest: an Adaptable Layout-Aware PDF-to-XML Textual Content Extractor for Scientific Articles	May 1, 2018	ArticlesNamed Entity Recognition (NER)	—Unverified	0
Building a Corpus from Handwritten Picture Postcards: Transcription, Annotation and Part-of-Speech Tagging	May 1, 2018	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified	0
A Multi-faceted OCR Framework for Artificial Urdu News Ticker Text Recognition	Apr 24, 2018	Optical Character Recognition (OCR)Retrieval	—Unverified	0
French Word Recognition through a Quick Survey on Recurrent Neural Networks Using Long-Short Term Memory RNN-LSTM	Apr 10, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
The Monge-Kantorovich Optimal Transport Distance for Image Comparison	Apr 8, 2018	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
Neural Monkey: The Current State and Beyond	Mar 1, 2018	Image CaptioningMachine Translation	—Unverified	0

Show:10 25 50

← PrevPage 20 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified