Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1209 papers

Title	Date	Tasks	Status	Hype
Document Enhancement System Using Auto-encoders	Sep 14, 2019	DenoisingDocument Enhancement	—Unverified	0
Chargrid-OCR: End-to-end Trainable Optical Character Recognition for Printed Documents using Instance Segmentation	Sep 10, 2019	GPUInstance Segmentation	—Unverified	0
OCR4all -- An Open-Source Tool Providing a (Semi-)Automatic OCR Workflow for Historical Printings	Sep 9, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
HoughNet: neural network architecture for vanishing points detection	Sep 9, 2019	Optical Character Recognition (OCR)	—Unverified	0
An Efficient and Layout-Independent Automatic License Plate Recognition System Based on the YOLO detector	Sep 4, 2019	Data AugmentationGPU	CodeCode Available	0
PopEval: A Character-Level Approach to End-To-End Evaluation Compatible with Word-Level Benchmark Dataset	Aug 29, 2019	Optical Character Recognition (OCR)	CodeCode Available	0
Towards Unconstrained End-to-End Text Spotting	Aug 24, 2019	Instance SegmentationOptical Character Recognition (OCR)	—Unverified	0
A BLSTM Network for Printed Bengali OCR System with High Accuracy	Aug 23, 2019	Optical Character Recognition (OCR)Vocal Bursts Intensity Prediction	—Unverified	0
A Comparative Study of Filtering Approaches Applied to Color Archival Document Images	Aug 16, 2019	DenoisingImage Enhancement	—Unverified	0
A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Multi-Task Learning	Aug 15, 2019	Multi-Task LearningOptical Character Recognition (OCR)	—Unverified	0
Nonparametric modeling cash flows of insurance company	Aug 14, 2019	Optical Character Recognition (OCR)	—Unverified	0
Self-supervised Data Bootstrapping for Deep Optical Character Recognition of Identity Documents	Aug 12, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Mitigating Noisy Inputs for Question Answering	Aug 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Answering Questions about Data Visualizations using Efficient Bimodal Fusion	Aug 5, 2019	Chart Question AnsweringOptical Character Recognition	CodeCode Available	0
OCR Quality and NLP Preprocessing	Aug 1, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Ekush: A Multipurpose and Multitype Comprehensive Database for Online Off-Line Bangla Handwritten Characters	Jul 17, 2019	Optical Character Recognition (OCR)	CodeCode Available	0
Multimodal deep networks for text and image-based document classification	Jul 15, 2019	ClassificationDocument Classification	CodeCode Available	0
A Novel Approach to OCR using Image Recognition based Classification for Ancient Tamil Inscriptions in Temples	Jul 4, 2019	BinarizationGeneral Classification	—Unverified	0
Brno Mobile OCR Dataset	Jul 2, 2019	BinarizationDenoising	CodeCode Available	0
Leveraging Text Repetitions and Denoising Autoencoders in OCR Post-correction	Jun 26, 2019	DenoisingOptical Character Recognition (OCR)	—Unverified	0
Machine Learning Construction: implications to cybersecurity	Jun 24, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
A Multitask Network for Localization and Recognition of Text in Images	Jun 21, 2019	Optical Character Recognition (OCR)	—Unverified	0
Handwritten Text Segmentation via End-to-End Learning of Convolutional Neural Network	Jun 12, 2019	Optical Character Recognition (OCR)Text Segmentation	CodeCode Available	0
Efficient, Lexicon-Free OCR using Deep Learning	Jun 5, 2019	Data AugmentationDeep Learning	—Unverified	0
Clustering-Based Article Identification in Historical Newspapers	Jun 1, 2019	ArticlesClustering	CodeCode Available	0
Deep Learning Approach for Receipt Recognition	May 30, 2019	DecoderDeep Learning	—Unverified	0
A Cost Efficient Approach to Correct OCR Errors in Large Document Collections	May 28, 2019	ClusteringLanguage Modelling	—Unverified	0
FUNSD: A Dataset for Form Understanding in Noisy Scanned Documents	May 27, 2019	FormOptical Character Recognition	CodeCode Available	1
Integration of Text-maps in Convolutional Neural Networks for Region Detection among Different Textual Categories	May 26, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Stroke extraction for offline handwritten mathematical expression recognition	May 16, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Enhancing Cross-task Transferability of Adversarial Examples with Dispersion Reduction	May 8, 2019	image-classificationImage Classification	CodeCode Available	0
Object detection deep learning networks for Optical Character Recognition	May 1, 2019	Deep LearningDocument Classification	CodeCode Available	0
Producing Corpora of Medieval and Premodern Occitan	Apr 26, 2019	LemmatizationOptical Character Recognition	—Unverified	0
A Scalable Handwritten Text Recognition System	Apr 19, 2019	Handwriting RecognitionHandwritten Text Recognition	—Unverified	0
An Ensemble of Neural Networks for Non-Linear Segmentation of Overlapped Cursive Script	Apr 7, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Diversified Hidden Markov Models for Sequential Labeling	Apr 5, 2019	DiversityOptical Character Recognition	—Unverified	0
Shape Robust Text Detection with Progressive Scale Expansion Network	Mar 28, 2019	Optical Character Recognition (OCR)Scene Text Detection	CodeCode Available	1
Automatic Classification of Pathology Reports using TF-IDF Features	Mar 5, 2019	ClassificationDiagnostic	—Unverified	0
Convolutional Neural Networks for Automatic Meter Reading	Feb 25, 2019	Counter RecognitionData Augmentation	—Unverified	0
OCR evaluation tools for the 21st century	Feb 1, 2019	Optical Character Recognition (OCR)	—Unverified	0
Multikernel activation functions: formulation and a case study	Jan 29, 2019	Optical Character Recognition (OCR)	—Unverified	0
SAML-QC: a Stochastic Assessment and Machine Learning based QC technique for Industrial Printing	Jan 18, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
A Multi-Object Rectified Attention Network for Scene Text Recognition	Jan 10, 2019	DecoderObject	CodeCode Available	0
Lipi Gnani - A Versatile OCR for Documents in any Language Printed in Kannada Script	Jan 2, 2019	BinarizationOptical Character Recognition (OCR)	—Unverified	0
An OCR system for the Unified Northern Alphabet	Jan 1, 2019	Optical Character Recognition (OCR)	CodeCode Available	0
Accurate, Data-Efficient, Unconstrained Text Recognition with Convolutional Neural Networks	Dec 31, 2018	Handwriting RecognitionLicense Plate Recognition	CodeCode Available	1
TextNet: Irregular Text Reading from Images with an End-to-End Trainable Network	Dec 24, 2018	Optical Character Recognition (OCR)Text Detection	—Unverified	0
Dynamic Programming Approach to Template-based OCR	Dec 19, 2018	Optical Character Recognition (OCR)Position	—Unverified	0
Pay Voice: Point of Sale Recognition for Visually Impaired People	Dec 14, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Deep Reader: Information extraction from Document images via relation extraction and Natural Language	Dec 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 19 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified