Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1209 papers

Title	Date	Tasks	Status	Hype
Object Detection and Recognition of Swap-Bodies using Camera mounted on a Vehicle	Apr 17, 2020	Data Augmentationobject-detection	—Unverified	0
PICK: Processing Key Information Extraction from Documents using Improved Graph Learning-Convolutional Networks	Apr 16, 2020	Graph LearningKey Information Extraction	CodeCode Available	1
An Evaluation of DNN Architectures for Page Segmentation of Historical Newspapers	Apr 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Sparse Concept Coded Tetrolet Transform for Unconstrained Odia Character Recognition	Apr 3, 2020	Optical Character Recognition (OCR)	—Unverified	0
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks	Mar 27, 2020	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified	0
Real-time information retrieval from Identity cards	Mar 26, 2020	Face DetectionInformation Retrieval	—Unverified	0
TextCaps: a Dataset for Image Captioning with Reading Comprehension	Mar 24, 2020	Image CaptioningOptical Character Recognition	—Unverified	0
ScrabbleGAN: Semi-Supervised Varying Length Handwritten Text Generation	Mar 23, 2020	Domain AdaptationHandwriting generation	CodeCode Available	1
Confronting the Constraints for Optical Character Segmentation from Printed Bangla Text Image	Mar 18, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection	Mar 17, 2020	graph constructionOptical Character Recognition (OCR)	CodeCode Available	1
Multistage Curvilinear Coordinate Transform Based Document Image Dewarping using a Novel Quality Estimator	Mar 15, 2020	Optical Character Recognition (OCR)	—Unverified	0
Investigating the Decoders of Maximum Likelihood Sequence Models: A Look-ahead Approach	Mar 8, 2020	Machine TranslationMultimodal Machine Translation	—Unverified	0
ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep Learning	Feb 23, 2020	ArticlesDeep Learning	CodeCode Available	0
LAMBERT: Layout-Aware (Language) Modeling for information extraction	Feb 19, 2020	Key Information ExtractionLanguage Modeling	CodeCode Available	1
Attacking Optical Character Recognition (OCR) Systems with Adversarial Watermarks	Feb 8, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Plague Dot Text: Text mining and annotation of outbreak reports of the Third Plague Pandemic (1894-1952)	Feb 4, 2020	EpidemiologyOptical Character Recognition	—Unverified	0
Pseudo-Bidirectional Decoding for Local Sequence Transduction	Jan 31, 2020	DecoderGrammatical Error Correction	—Unverified	0
Table Structure Extraction with Bi-directional Gated Recurrent Unit Networks	Jan 8, 2020	document understandingOptical Character Recognition	—Unverified	0
Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)	Jan 1, 2020	ArticlesOptical Character Recognition	—Unverified	0
DDI-100: Dataset for Text Detection and Recognition	Dec 25, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Evaluating Usage of Images for App Classification	Dec 16, 2019	ClassificationGeneral Classification	—Unverified	0
Indiscapes: Instance Segmentation Networks for Layout Parsing of Historical Indic Manuscripts	Dec 15, 2019	DiversityInstance Segmentation	CodeCode Available	0
Visual Summarization of Scholarly Videos using Word Embeddings and Keyphrase Extraction	Nov 25, 2019	Keyphrase ExtractionOptical Character Recognition	—Unverified	0
Cascaded Detail-Preserving Networks for Super-Resolution of Document Images	Nov 25, 2019	Image Super-ResolutionOptical Character Recognition (OCR)	—Unverified	0
Image-based table recognition: data, model, and evaluation	Nov 25, 2019	ArticlesDecoder	CodeCode Available	1
Real-time Scene Text Detection with Differentiable Binarization	Nov 20, 2019	BinarizationOptical Character Recognition (OCR)	CodeCode Available	2
Handwritten and Machine printed OCR for Geez Numbers Using Artificial Neural Network	Nov 15, 2019	Image RetrievalOptical Character Recognition (OCR)	—Unverified	0
Character Keypoint-based Homography Estimation in Scanned Documents for Efficient Information Extraction	Nov 14, 2019	Homography EstimationOptical Character Recognition	—Unverified	0
Vehicle-Rear: A New Dataset to Explore Feature Fusion for Vehicle Identification Using Convolutional Neural Networks	Nov 13, 2019	Fine-Grained Vehicle ClassificationLicense Plate Detection	CodeCode Available	0
Recognition of Images of Korean Characters Using Embedded Networks	Nov 11, 2019	Optical Character Recognition (OCR)	—Unverified	0
Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory	Nov 5, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
VASTA: A Vision and Language-assisted Smartphone Task Automation System	Nov 4, 2019	ClusteringNatural Language Understanding	—Unverified	0
BIOfid Dataset: Publishing a German Gold Standard for Named Entity Recognition in Historical Biodiversity Literature	Nov 1, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified	0
DeepErase: Weakly Supervised Ink Artifact Removal in Document Text Images	Oct 15, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
From the Paft to the Fiiture: a Fully Automatic NMT and Word Embeddings Method for OCR Post-Correction	Oct 12, 2019	BIG-bench Machine LearningMachine Translation	CodeCode Available	0
Rosetta: Large scale system for text detection and recognition in images	Oct 11, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
MIDV-2019: Challenges of the modern mobile-based document OCR	Oct 9, 2019	Face DetectionOptical Character Recognition (OCR)	CodeCode Available	0
Membership Model Inversion Attacks for Deep Networks	Oct 9, 2019	modelOptical Character Recognition (OCR)	—Unverified	0
Parallel Iterative Edit Models for Local Sequence Transduction	Oct 7, 2019	DecoderGrammatical Error Correction	CodeCode Available	0
NASS-AI: Towards Digitization of Parliamentary Bills using Document Level Embedding and Bidirectional Long Short-Term Memory	Oct 2, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regression Networks	Oct 1, 2019	3D geometryLocal Distortion	CodeCode Available	0
Multi-modal Page Stream Segmentation with Convolutional Neural Networks	Sep 27, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Document Rectification and Illumination Correction using a Patch-based CNN	Sep 20, 2019	Optical Character Recognition (OCR)	CodeCode Available	0
EATEN: Entity-aware Attention for Single Shot Visual Text Extraction	Sep 20, 2019	DecoderEntity Extraction using GAN	CodeCode Available	0
Corporate IT-support Help-Desk Process Hybrid-Automation Solution with Machine Learning Approach	Sep 18, 2019	BIG-bench Machine LearningOptical Character Recognition (OCR)	—Unverified	0
Fast Search with Poor OCR	Sep 17, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Post-OCR parsing: building simple and robust parser via BIO tagging	Sep 14, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Chargrid-OCR: End-to-end trainable Optical Character Recognition through Semantic Segmentation and Object Detection	Sep 14, 2019	GPUobject-detection	—Unverified	0
CORD: A Consolidated Receipt Dataset for Post-OCR Parsing	Sep 14, 2019	Optical Character Recognition (OCR)Semantic Parsing	CodeCode Available	0
SVDocNet: Spatially Variant U-Net for Blind Document Deblurring	Sep 14, 2019	DeblurringOptical Character Recognition	—Unverified	0

Show:10 25 50

← PrevPage 18 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified