Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1209 papers

Title	Date	Tasks	Status
An OCR system for the Unified Northern Alphabet	Jan 1, 2019	Optical Character Recognition (OCR)	CodeCode Available
TextNet: Irregular Text Reading from Images with an End-to-End Trainable Network	Dec 24, 2018	Optical Character Recognition (OCR)Text Detection	—Unverified
Dynamic Programming Approach to Template-based OCR	Dec 19, 2018	Optical Character Recognition (OCR)Position	—Unverified
Pay Voice: Point of Sale Recognition for Visually Impaired People	Dec 14, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Deep Reader: Information extraction from Document images via relation extraction and Natural Language	Dec 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Neural Probabilistic System for Text Recognition	Dec 10, 2018	Optical Character Recognition (OCR)	—Unverified
Binary Document Image Super Resolution for Improved Readability and OCR Performance	Dec 6, 2018	Image Super-ResolutionInformation Retrieval	CodeCode Available
Extracting structured data from invoices	Dec 1, 2018	BIG-bench Machine LearningOptical Character Recognition (OCR)	—Unverified
A Compositional Textual Model for Recognition of Imperfect Word Images	Nov 27, 2018	Optical Character Recognition (OCR)Printed Text Recognition	—Unverified
From Videos to URLs: A Multi-Browser Guide To Extract User's Behavior with Optical Character Recognition	Nov 15, 2018	MarketingOptical Character Recognition	CodeCode Available
Survey of Computational Approaches to Lexical Semantic Change	Nov 15, 2018	Change DetectionInformation Retrieval	—Unverified
Auto-ML Deep Learning for Rashi Scripts OCR	Nov 3, 2018	AutoMLDeep Learning	—Unverified
Combining Human and Machine Transcriptions on the Zooniverse Platform	Nov 1, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Image-based Natural Language Understanding Using 2D Convolutional Neural Networks	Oct 24, 2018	ClassificationGeneral Classification	—Unverified
Resolving Referring Expressions in Images With Labeled Elements	Oct 24, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
State of the Art Optical Character Recognition of 19th Century Fraktur Scripts using Open Source Engines	Oct 8, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check	Oct 1, 2018	Language ModelingLanguage Modelling	CodeCode Available
Zero-Shot Learning Based Approach For Medieval Word Recognition Using Deep-Learned Features	Oct 1, 2018	AttributeGeneralized Zero-Shot Learning	—Unverified
Ground Truth for training OCR engines on historical documents in German Fraktur and Early Modern Latin	Sep 14, 2018	Optical Character Recognition (OCR)	—Unverified
Upcycle Your OCR: Reusing OCRs for Post-OCR Text Correction in Romanised Sanskrit	Sep 6, 2018	Optical Character Recognition (OCR)	CodeCode Available
License Plate Detection and Recognition in Unconstrained Scenarios	Sep 1, 2018	License Plate DetectionLicense Plate Recognition	CodeCode Available
Indigenous language technologies in Canada: Assessment, challenges, and successes	Aug 1, 2018	Machine TranslationOptical Character Recognition	—Unverified
Local String Transduction as Sequence Labeling	Aug 1, 2018	LemmatizationMachine Translation	—Unverified
Towards an Automatic Classification of Illustrative Examples in a Large Japanese-French Dictionary Obtained by OCR	Aug 1, 2018	General ClassificationMachine Translation	—Unverified
CG-DIQA: No-reference Document Image Quality Assessment Based on Character Gradient	Jul 11, 2018	Document Image Quality AssessmentImage Quality Assessment	—Unverified
FINN-L: Library Extensions and Design Trade-off Analysis for Variable Precision LSTM Networks on FPGAs	Jul 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Sum-Product Networks for Sequence Labeling	Jul 6, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Calamari - A High-Performance Tensorflow-based Deep Learning Package for Optical Character Recognition	Jul 5, 2018	GPUOptical Character Recognition	CodeCode Available
Multi-Input Attention for Unsupervised OCR Correction	Jul 1, 2018	DecoderOptical Character Recognition (OCR)	—Unverified
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification	Jun 25, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Deductron -- A Recurrent Neural Network	Jun 23, 2018	Image to textOptical Character Recognition (OCR)	—Unverified
Recommending Scientific Videos based on Metadata Enrichment using Linked Open Data	Jun 19, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Recognition	Jun 4, 2018	DecoderOptical Character Recognition (OCR)	CodeCode Available
Confidence Prediction for Lexicon-Free OCR	May 28, 2018	General ClassificationMulti-class Classification	—Unverified
Implicit Language Model in LSTM for OCR	May 23, 2018	Language ModelingLanguage Modelling	CodeCode Available
IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Text Detection	May 3, 2018	Multi-Oriented Scene Text Detectionobject-detection	—Unverified
PDFdigest: an Adaptable Layout-Aware PDF-to-XML Textual Content Extractor for Scientific Articles	May 1, 2018	ArticlesNamed Entity Recognition (NER)	—Unverified
PDF-to-Text Reanalysis for Linguistic Data Mining	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
Building a Corpus from Handwritten Picture Postcards: Transcription, Annotation and Part-of-Speech Tagging	May 1, 2018	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
TF-LM: TensorFlow-based Language Modeling Toolkit	May 1, 2018	Language ModelingLanguage Modelling	CodeCode Available
Towards Processing of the Oral History Interviews and Related Printed Documents	May 1, 2018	Automatic Speech Recognition (ASR)Optical Character Recognition (OCR)	—Unverified
Building A Handwritten Cuneiform Character Imageset	May 1, 2018	Machine TranslationOptical Character Recognition (OCR)	—Unverified
PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents	May 1, 2018	Coreference ResolutionOptical Character Recognition (OCR)	CodeCode Available
Delta vs. N-Gram Tracing: Evaluating the Robustness of Authorship Attribution Methods	May 1, 2018	Authorship AttributionOptical Character Recognition (OCR)	—Unverified
D\'etection d'erreurs dans des transcriptions OCR de documents historiques par r\'eseaux de neurones r\'ecurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
Computer-assisted Speaker Diarization: How to Evaluate Human Corrections	May 1, 2018	Active LearningFace Recognition	—Unverified
Measuring Innovation in Speech and Language Processing Publications.	May 1, 2018	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Matics Software Suite: New Tools for Evaluation and Data Exploration	May 1, 2018	Optical Character Recognition (OCR)Speaker Diarization	—Unverified
Low-resource Post Processing of Noisy OCR Output for Historical Corpus Digitisation	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods	May 1, 2018	ArticlesGrammatical Error Correction	—Unverified

Show:10 25 50

← PrevPage 20 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified