Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1209 papers

Title	Date	Tasks	Status
Crowdsourcing an OCR Gold Standard for a German and French Heritage Corpus	May 1, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Measuring Lexical Quality of a Historical Finnish Newspaper Collection â€• Analysis of Garbled OCR Data with Basic Language Technology Tools and Means	May 1, 2016	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Training \& Quality Assessment of an Optical Character Recognition Model for Northern Haida	May 1, 2016	Image GenerationOptical Character Recognition	—Unverified
Extracting Weighted Language Lexicons from Wikipedia	May 1, 2016	ArticlesInformation Retrieval	—Unverified
OCR Post-Correction Evaluation of Early Dutch Books Online - Revisited	May 1, 2016	Optical Character Recognition (OCR)	—Unverified
1 Million Captioned Dutch Newspaper Images	May 1, 2016	ArticlesData-to-Text Generation	—Unverified
OCR Error Correction Using Character Correction and Feature-Based Word Classification	Apr 21, 2016	General ClassificationLanguage Modeling	—Unverified
Overlay Text Extraction From TV News Broadcast	Apr 2, 2016	ArticlesOptical Character Recognition (OCR)	—Unverified
Robust Scene Text Recognition with Automatic Rectification	Mar 12, 2016	Optical Character Recognition (OCR)Scene Text Detection	CodeCode Available
Recursive Recurrent Nets with Attention Modeling for OCR in the Wild	Mar 9, 2016	Language ModelingLanguage Modelling	—Unverified
Resource Constrained Structured Prediction	Feb 28, 2016	Dependency ParsingOptical Character Recognition	—Unverified
Data Cleaning for XML Electronic Dictionaries via Statistical Anomaly Detection	Feb 25, 2016	Anomaly DetectionOptical Character Recognition	—Unverified
Improving patch-based scene text script identification with ensembles of conjoined networks	Feb 24, 2016	General ClassificationOptical Character Recognition (OCR)	CodeCode Available
Font Identification in Historical Documents Using Active Learning	Jan 27, 2016	Active LearningDiversity	—Unverified
COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images	Jan 26, 2016	DiversityGeneral Classification	CodeCode Available
Decoding Anagrammed Texts Written in an Unknown Language and Script	Jan 1, 2016	DeciphermentLanguage Identification	—Unverified
Finding Names in Trove: Named Entity Recognition for Australian Historical Newspapers	Dec 1, 2015	Clusteringnamed-entity-recognition	—Unverified
Comparison of Visual and Logical Character Segmentation in Tesseract OCR Language Data for Indic Writing Scripts	Dec 1, 2015	Optical Character Recognition (OCR)	—Unverified
Calibrated Structured Prediction	Dec 1, 2015	Medical DiagnosisOptical Character Recognition	CodeCode Available
Sequence to Sequence Learning for Optical Character Recognition	Nov 13, 2015	DecoderGeneral Classification	—Unverified
Directional Global Three-part Image Decomposition	Oct 6, 2015	Image CompressionOptical Character Recognition	—Unverified
Telugu OCR Framework using Deep Learning	Sep 20, 2015	Deep LearningGeneral Classification	—Unverified
OCR accuracy improvement on document images through a novel pre-processing approach	Sep 11, 2015	BinarizationOptical Character Recognition	—Unverified
Is it possible to recover personal health information from an automatically de-identified corpus of French EHRs?	Sep 1, 2015	Optical Character Recognition (OCR)	—Unverified
DanProof: Pedagogical Spell and Grammar Checking for Danish	Sep 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Statistical Machine Translation Improvement based on Phrase Selection	Sep 1, 2015	Language ModellingMachine Translation	—Unverified
Topic Stability over Noisy Sources	Aug 5, 2015	Model SelectionOptical Character Recognition (OCR)	—Unverified
A preliminary study on similarity-preserving digital book identifiers	Jul 1, 2015	Optical Character Recognition (OCR)	—Unverified
SAHSOH@QALB-2015 Shared Task: A Rule-Based Correction Method of Common Arabic Native and Non-Native Speakers' Errors	Jul 1, 2015	Machine TranslationMorphological Analysis	—Unverified
TECHLIMED@QALB-Shared Task 2015: a hybrid Arabic Error Correction System	Jul 1, 2015	Information RetrievalMachine Translation	—Unverified
A Linked Data Model for Multimodal Sentiment and Emotion Analysis	Jul 1, 2015	Emotion RecognitionOpinion Mining	—Unverified
License Plate Recognition System Based on Color Coding Of License Plates	Jun 8, 2015	License Plate RecognitionOptical Character Recognition	—Unverified
Boosting Optical Character Recognition: A Super-Resolution Approach	Jun 7, 2015	Image Super-ResolutionOptical Character Recognition	—Unverified
Automated Translation of a Literary Work: A Pilot Study	Jun 1, 2015	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Unsupervised Code-Switching for Multilingual Historical Document Transcription	May 1, 2015	Language IdentificationLanguage Modeling	—Unverified
Squibs: Spelling Error Patterns in Brazilian Portuguese	Mar 1, 2015	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Regularization and Kernelization of the Maximin Correlation Approach	Feb 21, 2015	ClassificationGeneral Classification	—Unverified
A survey of modern optical character recognition techniques	Dec 13, 2014	Image EnhancementOptical Character Recognition	—Unverified
A Study of Sindhi Related and Arabic Script Adapted languages Recognition	Dec 13, 2014	ArticlesOptical Character Recognition	—Unverified
Learning Multiple Tasks in Parallel with a Shared Annotator	Dec 1, 2014	Binary ClassificationDocument Classification	—Unverified
Efficient Media Retrieval from Non-Cooperative Queries	Nov 19, 2014	Optical Character Recognition (OCR)Retrieval	—Unverified
Optical Character Recognition, Using K-Nearest Neighbors	Nov 5, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR and Automated Translation for the Navigation of non-English Handsets: A Feasibility Study with Arabic	Nov 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
A random forest system combination approach for error detection in digital dictionaries	Oct 30, 2014	Language ModelingLanguage Modelling	—Unverified
Improve CAPTCHA's Security Using Gaussian Blur Filter	Oct 16, 2014	Optical Character Recognition (OCR)	—Unverified
Autocorrection of arabic common errors for large text corpus	Oct 1, 2014	Morphological AnalysisOptical Character Recognition (OCR)	—Unverified
Balanced Korean Word Spacing with Structural SVM	Oct 1, 2014	Information RetrievalMorphological Analysis	—Unverified
TECHLIMED system description for the Shared Task on Automatic Arabic Error Correction	Oct 1, 2014	Information RetrievalMachine Translation	—Unverified
CMUQ@QALB-2014: An SMT-based System for Automatic Arabic Error Correction	Oct 1, 2014	Language ModellingMachine Translation	—Unverified
Bypassing Captcha By Machine A Proof For Passing The Turing Test	Sep 3, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 23 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified