Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1209 papers

Title	Date	Tasks	Status	Hype
PP-OCR: A Practical Ultra Lightweight OCR System	Sep 21, 2020	Computational EfficiencyOptical Character Recognition	CodeCode Available	2
An Efficient Language-Independent Multi-Font OCR for Arabic Script	Sep 18, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Deep Learning Approach to Geographical Candidate Selection through Toponym Matching	Sep 17, 2020	Deep LearningEntity Resolution	CodeCode Available	1
Word Segmentation from Unconstrained Handwritten Bangla Document Images using Distance Transform	Sep 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A New Approach for Texture based Script Identification At Block Level using Quad Tree Decomposition	Sep 16, 2020	Optical Character Recognition (OCR)Tree Decomposition	—Unverified	0
Handwritten Script Identification from Text Lines	Sep 16, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified	0
Abstractive Information Extraction from Scanned Invoices (AIESI) using End-to-end Sequential Approach	Sep 12, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
MRZ code extraction from visa and passport documents using convolutional neural networks	Sep 11, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
OCR Graph Features for Manipulation Detection in Documents	Sep 10, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Optical Character Recognition, Word Segmentation, Sentence Segmentation, and Information Extraction for Historical and Literature Texts in Classical Chinese	Sep 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
EASTER: Efficient and Scalable Text Recognizer	Aug 18, 2020	BenchmarkingHandwritten Text Recognition	—Unverified	0
On the Accuracy of CRNNs for Line-Based OCR: A Multi-Parameter Evaluation	Aug 6, 2020	BinarizationData Augmentation	—Unverified	0
Can You Read Me Now? Content Aware Rectification using Angle Supervision	Aug 5, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Weakly Supervised Construction of ASR Systems with Massive Video Data	Aug 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An End-to-End OCR Text Re-organization Sequence Learning for Rich-text Detail Image Comprehension	Aug 1, 2020	Decoderglobal-optimization	—Unverified	0
Advancing Visual Specification of Code Requirements for Graphs	Jul 29, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Adapting OCR with limited supervision	Jul 27, 2020	Optical Character Recognition (OCR)	CodeCode Available	1
Spatially Aware Multimodal Transformers for TextVQA	Jul 23, 2020	Optical Character Recognition (OCR)Spatial Reasoning	CodeCode Available	1
Deep Learning Based Traffic Surveillance System For Missing and Suspicious Car Detection	Jul 17, 2020	Generative Adversarial NetworkOptical Character Recognition	—Unverified	0
Attack of the Tails: Yes, You Really Can Backdoor Federated Learning	Jul 9, 2020	FairnessFederated Learning	CodeCode Available	1
Fused Text Recogniser and Deep Embeddings Improve Word Recognition and Retrieval	Jul 1, 2020	Optical Character Recognition (OCR)Retrieval	CodeCode Available	1
Improving accuracy and speeding up Document Image Classification through parallel systems	Jun 16, 2020	Document Classificationdocument-image-classification	CodeCode Available	1
CLEval: Character-Level Evaluation for Text Detection and Recognition Tasks	Jun 11, 2020	Optical Character Recognition (OCR)Text Detection	CodeCode Available	1
Fully Unsupervised Diversity Denoising with Convolutional Variational Autoencoders	Jun 10, 2020	Cell SegmentationDenoising	CodeCode Available	1
Tamil Vowel Recognition With Augmented MNIST-like Data Set	Jun 9, 2020	ClassificationGeneral Classification	—Unverified	0
Exploiter des mod\`eles de langue pour \'evaluer des sorties de logiciels d'OCR pour des documents fran du XVIIe si\`ecle ()	Jun 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified	0
Structured Multimodal Attentions for TextVQA	Jun 1, 2020	Graph AttentionOptical Character Recognition (OCR)	CodeCode Available	1
SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition	May 22, 2020	DecoderOptical Character Recognition (OCR)	CodeCode Available	1
NAT: Noise-Aware Training for Robust Neural Sequence Labeling	May 14, 2020	Data Augmentationnamed-entity-recognition	CodeCode Available	1
Large Scale Font Independent Urdu Text Recognition System	May 14, 2020	Incremental LearningOptical Character Recognition (OCR)	CodeCode Available	1
Computer Vision Toolkit for Non-invasive Monitoring of Factory Floor Artifacts	May 12, 2020	Anomaly DetectionContour Detection	—Unverified	0
Quantitative Analysis of Image Classification Techniques for Memory-Constrained Devices	May 11, 2020	ClassificationGeneral Classification	—Unverified	0
Deep Learning Based Vehicle Tracking System Using License Plate Detection And Recognition	May 10, 2020	GPULicense Plate Detection	—Unverified	0
A Hybrid Swarm and Gravitation based feature selection algorithm for Handwritten Indic Script Classification problem	May 10, 2020	Classificationfeature selection	—Unverified	0
Development of a New Image-to-text Conversion System for Pashto, Farsi and Traditional Chinese	May 8, 2020	Image to textOptical Character Recognition (OCR)	—Unverified	0
A Gaussian Process Upsampling Model for Improvements in Optical Character Recognition	May 7, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
The Newspaper Navigator Dataset: Extracting And Analyzing Visual Content from 16 Million Historic Newspaper Pages in Chronicling America	May 4, 2020	Optical Character Recognition (OCR)	CodeCode Available	1
Books of Hours. the First Liturgical Data Set for Text Segmentation.	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified	0
How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified	0
Time-Aware Word Embeddings for Three Lebanese News Archives	May 1, 2020	Optical Character Recognition (OCR)Word Embeddings	CodeCode Available	0
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Constructing a Public Meeting Corpus	May 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
Preserving Semantic Information from Old Dictionaries: Linking Senses of the `Altfranz\"osisches W\"orterbuch' to WordNet	May 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
OdiEnCorp 2.0: Odia-English Parallel Corpus for Machine Translation	May 1, 2020	Machine TranslationNMT	—Unverified	0
MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten Compound Characters	Apr 29, 2020	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Skip-connected Multi-column Network for Isolated Handwritten Bangla Character and Digit recognition	Apr 27, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
A Tool for Facilitating OCR Postediting in Historical Documents	Apr 23, 2020	Language ModelingLanguage Modelling	CodeCode Available	0
Image Processing Based Scene-Text Detection and Recognition with Tesseract	Apr 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 17 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified