Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1209 papers

Title	Date	Tasks	Status
Discovering Airline-Specific Business Intelligence from Online Passenger Reviews: An Unsupervised Text Analytics Approach	Dec 14, 2020	Opinion MiningOptical Character Recognition (OCR)	—Unverified
Vartani Spellcheck -- Automatic Context-Sensitive Spelling Correction of OCR-generated Hindi Text Using BERT and Levenshtein Distance	Dec 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps	Dec 9, 2020	DecoderImage Captioning	—Unverified
BennettNLP at SemEval-2020 Task 8: Multimodal sentiment classification Using Hybrid Hierarchical Classifier	Dec 1, 2020	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified
Detecting de minimis Code-Switching in Historical German Books	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SIS@IIITH at SemEval-2020 Task 8: An Overview of Simple Text Classification Methods for Meme Analysis	Dec 1, 2020	ClassificationOptical Character Recognition (OCR)	—Unverified
Ad Lingua: Text Classification Improves Symbolism Prediction in Image Advertisements	Dec 1, 2020	Language ModelingLanguage Modelling	—Unverified
Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia)	Dec 1, 2020	Optical Character Recognition (OCR)POS	CodeCode Available
CSECU\_KDE\_MA at SemEval-2020 Task 8: A Neural Attention Model for Memotion Analysis	Dec 1, 2020	Optical Character Recognition (OCR)	—Unverified
A Survey of Deep Learning Approaches for OCR and Document Understanding	Nov 27, 2020	document understandingOptical Character Recognition (OCR)	CodeCode Available
A Panoramic Survey of Natural Language Processing in the Arab World	Nov 25, 2020	Machine TranslationOptical Character Recognition	—Unverified
SuperOCR: A Conversion from Optical Character Recognition to Image Captioning	Nov 21, 2020	Image CaptioningLicense Plate Recognition	—Unverified
On-Device Text Image Super Resolution	Nov 20, 2020	Cloud ComputingGPU	—Unverified
Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts	Nov 18, 2020	Clusteringnamed-entity-recognition	—Unverified
On-Device Language Identification of Text in Images using Diacritic Characters	Nov 10, 2020	Language Identificationobject-detection	—Unverified
Automated data extraction of bar chart raster images	Nov 9, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Handwriting Classification for the Analysis of Art-Historical Documents	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available
Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive	Nov 2, 2020	HTROptical Character Recognition (OCR)	—Unverified
OCR, Classification & Machine Translation (OCCAM)	Nov 1, 2020	Classificationimage-classification	—Unverified
Chunk-based Chinese Spelling Check with Global Optimization	Nov 1, 2020	global-optimizationOptical Character Recognition	—Unverified
Alleviating Digitization Errors in Named Entity Recognition for Historical Documents	Nov 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Persian Handwritten Digit, Character and Word Recognition Using Deep Learning	Oct 24, 2020	Data AugmentationDeep Learning	—Unverified
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified
A Conglomerate of Multiple OCR Table Detection and Extraction	Oct 16, 2020	Optical Character Recognition (OCR)Table Detection	—Unverified
DocStruct: A Multimodal Method to Extract Hierarchy Structure in Document for General Form Understanding	Oct 15, 2020	FormOptical Character Recognition (OCR)	—Unverified
Finding the Evidence: Localization-aware Answer Prediction for Text Visual Question Answering	Oct 6, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition	Sep 23, 2020	DecoderOptical Character Recognition (OCR)	—Unverified
Towards Image-based Automatic Meter Reading in Unconstrained Scenarios: A Robust and Efficient Approach	Sep 21, 2020	Image-based Automatic Meter ReadingMeter Reading	—Unverified
An Efficient Language-Independent Multi-Font OCR for Arabic Script	Sep 18, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Word Segmentation from Unconstrained Handwritten Bangla Document Images using Distance Transform	Sep 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Handwritten Script Identification from Text Lines	Sep 16, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A New Approach for Texture based Script Identification At Block Level using Quad Tree Decomposition	Sep 16, 2020	Optical Character Recognition (OCR)Tree Decomposition	—Unverified
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified
Abstractive Information Extraction from Scanned Invoices (AIESI) using End-to-end Sequential Approach	Sep 12, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
MRZ code extraction from visa and passport documents using convolutional neural networks	Sep 11, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
OCR Graph Features for Manipulation Detection in Documents	Sep 10, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Optical Character Recognition, Word Segmentation, Sentence Segmentation, and Information Extraction for Historical and Literature Texts in Classical Chinese	Sep 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
EASTER: Efficient and Scalable Text Recognizer	Aug 18, 2020	BenchmarkingHandwritten Text Recognition	—Unverified
On the Accuracy of CRNNs for Line-Based OCR: A Multi-Parameter Evaluation	Aug 6, 2020	BinarizationData Augmentation	—Unverified
Can You Read Me Now? Content Aware Rectification using Angle Supervision	Aug 5, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Weakly Supervised Construction of ASR Systems with Massive Video Data	Aug 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An End-to-End OCR Text Re-organization Sequence Learning for Rich-text Detail Image Comprehension	Aug 1, 2020	Decoderglobal-optimization	—Unverified
Advancing Visual Specification of Code Requirements for Graphs	Jul 29, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Deep Learning Based Traffic Surveillance System For Missing and Suspicious Car Detection	Jul 17, 2020	Generative Adversarial NetworkOptical Character Recognition	—Unverified
Tamil Vowel Recognition With Augmented MNIST-like Data Set	Jun 9, 2020	ClassificationGeneral Classification	—Unverified
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified
Exploiter des mod\`eles de langue pour \'evaluer des sorties de logiciels d'OCR pour des documents fran du XVIIe si\`ecle ()	Jun 1, 2020	Optical Character Recognition (OCR)	—Unverified
Computer Vision Toolkit for Non-invasive Monitoring of Factory Floor Artifacts	May 12, 2020	Anomaly DetectionContour Detection	—Unverified
Quantitative Analysis of Image Classification Techniques for Memory-Constrained Devices	May 11, 2020	ClassificationGeneral Classification	—Unverified
Deep Learning Based Vehicle Tracking System Using License Plate Detection And Recognition	May 10, 2020	GPULicense Plate Detection	—Unverified

Show:10 25 50

← PrevPage 17 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified