Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1209 papers

Title	Date	Tasks	Status
A System for Identifying and Exploring Text Repetition in Large Historical Document Corpora	May 1, 2017	Optical Character Recognition (OCR)	—Unverified
Automatic Compositor Attribution in the First Folio of Shakespeare	Apr 25, 2017	ClusteringOptical Character Recognition (OCR)	—Unverified
Scatteract: Automated extraction of data from scatter plots	Apr 21, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCRAPOSE II: An OCR-based indoor positioning system using mobile phone images	Apr 19, 2017	Depth EstimationOptical Character Recognition	—Unverified
Attention-based Extraction of Structured Information from Street View Imagery	Apr 11, 2017	Optical Character Recognition (OCR)	CodeCode Available
Effective search space reduction for spell correction using character neural embeddings	Apr 1, 2017	Optical Character Recognition (OCR)	—Unverified
Important New Developments in Arabographic Optical Character Recognition (OCR)	Mar 28, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Content-based similar document image retrieval using fusion of CNN features	Mar 23, 2017	Image RetrievalOptical Character Recognition (OCR)	—Unverified
A Holistic Approach for Optimizing DSP Block Utilization of a CNN implementation on FPGA	Mar 21, 2017	Optical Character Recognition (OCR)	—Unverified
Twitter100k: A Real-world Dataset for Weakly Supervised Cross-Media Retrieval	Mar 20, 2017	Optical Character Recognition (OCR)Retrieval	—Unverified
Endangered Data for Endangered Languages: Digitizing Print dictionaries	Mar 1, 2017	Optical Character Recognition (OCR)	—Unverified
End-to-End Interpretation of the French Street Name Signs Dataset	Feb 13, 2017	Optical Character Recognition (OCR)	CodeCode Available
Language Independent Single Document Image Super-Resolution using CNN for improved recognition	Jan 30, 2017	Image EnhancementImage Super-Resolution	—Unverified
Document Decomposition of Bangla Printed Text	Jan 27, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
LAREX - A semi-automatic open-source Tool for Layout Analysis and Region Extraction on Early Printed Books	Jan 20, 2017	Optical Character Recognition (OCR)	CodeCode Available
Case Study of a highly automated Layout Analysis and OCR of an incunabulum: 'Der Heiligen Leben' (1488)	Jan 20, 2017	Optical Character Recognition (OCR)	CodeCode Available
Profiling of OCR'ed Historical Texts Revisited	Jan 19, 2017	Optical Character Recognition (OCR)	—Unverified
Mining Spatio-temporal Data on Industrialization from Historical Registries	Dec 3, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Recognition of Text Image Using Multilayer Perceptron	Dec 2, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
papago: A Machine Translation Service with Word Sense Disambiguation and Currency Conversion	Dec 1, 2016	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Implementation of a Workflow Management System for Non-Expert Users	Dec 1, 2016	ManagementOptical Character Recognition (OCR)	—Unverified
Detection of Text Reuse in French Medical Corpora	Dec 1, 2016	De-identificationOptical Character Recognition (OCR)	—Unverified
Integrating Optical Character Recognition and Machine Translation of Historical Documents	Dec 1, 2016	Language ModelingLanguage Modelling	—Unverified
Align Me: A framework to generate Parallel Corpus Using OCRs and Bilingual Dictionaries	Dec 1, 2016	Active LearningInformation Retrieval	—Unverified
Providing and Analyzing NLP Terms for our Community	Dec 1, 2016	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified
Statistical Learning for OCR Text Correction	Nov 21, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Old Content and Modern Tools - Searching Named Entities in a Finnish OCRed Historical Newspaper Collection 1771-1910	Nov 9, 2016	named-entity-recognitionNamed Entity Recognition	—Unverified
Chinese/English mixed Character Segmentation as Semantic Segmentation	Nov 7, 2016	DiversityOptical Character Recognition (OCR)	—Unverified
Latent Tree Language Model	Nov 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	CodeCode Available
Low-resource OCR error detection and correction in French Clinical Texts	Nov 1, 2016	Language ModelingLanguage Modelling	—Unverified
Still not there? Comparing Traditional Sequence-to-Sequence Models to Encoder-Decoder Neural Networks on Monotone String Translation Tasks	Oct 25, 2016	DecoderGrapheme-to-Phoneme Conversion	—Unverified
Proposal for Automatic License and Number Plate Recognition System for Vehicle Identification	Oct 9, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR++: A Robust Framework For Information Extraction from Scholarly Articles	Sep 23, 2016	ArticlesOptical Character Recognition (OCR)	—Unverified
Star-net: A spatial attention residue network for scene text recognition.	Sep 20, 2016	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
OCR of historical printings with an application to building diachronic corpora: A case study using the RIDGES herbal corpus	Aug 6, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Combining Phonology and Morphology for the Normalization of Historical Texts	Aug 1, 2016	Machine TranslationOptical Character Recognition (OCR)	—Unverified
N-gram language models for massively parallel devices	Aug 1, 2016	Language ModelingLanguage Modelling	—Unverified
Data-Driven Spelling Correction using Weighted Finite-State Methods	Aug 1, 2016	Optical Character Recognition (OCR)Spelling Correction	CodeCode Available
Pynini: A Python library for weighted finite-state grammar compilation	Aug 1, 2016	Automatic Speech Recognition (ASR)Optical Character Recognition (OCR)	—Unverified
Evaluating Inter-Annotator Agreement on Historical Spelling Normalization	Aug 1, 2016	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
Semi-automated annotation of page-based documents within the Genre and Multimodality framework	Aug 1, 2016	Optical Character Recognition (OCR)	—Unverified
Unsupervised morph segmentation and statistical language models for vocabulary expansion	Aug 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Benchmark for License Plate Character Segmentation	Jul 11, 2016	License Plate DetectionLicense Plate Recognition	—Unverified
Artificial neural networks and fuzzy logic for recognizing alphabet characters and mathematical symbols	Jul 6, 2016	Image SegmentationOptical Character Recognition	—Unverified
How many faces can be recognized? Performance extrapolation for multi-class classification	Jun 16, 2016	General ClassificationMulti-class Classification	—Unverified
An Unsupervised Model of Orthographic Variation for Historical Document Transcription	Jun 1, 2016	Optical Character Recognition (OCR)	CodeCode Available
An efficient way for segmentation of Bangla characters in printed document using curved scanning	May 13, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
A Generic Method for Automatic Ground Truth Generation of Camera-captured Documents	May 4, 2016	ArticlesOptical Character Recognition (OCR)	—Unverified
Using SMT for OCR Error Correction of Historical Texts	May 1, 2016	ArticlesLanguage Modelling	—Unverified
OpenSubtitles2016: Extracting Large Parallel Corpora from Movie and TV Subtitles	May 1, 2016	Optical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 22 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified