Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1209 papers

Title	Date	Tasks	Status
A Hybrid Swarm and Gravitation based feature selection algorithm for Handwritten Indic Script Classification problem	May 10, 2020	Classificationfeature selection	—Unverified
Development of a New Image-to-text Conversion System for Pashto, Farsi and Traditional Chinese	May 8, 2020	Image to textOptical Character Recognition (OCR)	—Unverified
A Gaussian Process Upsampling Model for Improvements in Optical Character Recognition	May 7, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
OdiEnCorp 2.0: Odia-English Parallel Corpus for Machine Translation	May 1, 2020	Machine TranslationNMT	—Unverified
How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified
Books of Hours. the First Liturgical Data Set for Text Segmentation.	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified
Preserving Semantic Information from Old Dictionaries: Linking Senses of the `Altfranz\"osisches W\"orterbuch' to WordNet	May 1, 2020	Optical Character Recognition (OCR)	—Unverified
Constructing a Public Meeting Corpus	May 1, 2020	Optical Character Recognition (OCR)	—Unverified
Time-Aware Word Embeddings for Three Lebanese News Archives	May 1, 2020	Optical Character Recognition (OCR)Word Embeddings	CodeCode Available
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten Compound Characters	Apr 29, 2020	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified
A Skip-connected Multi-column Network for Isolated Handwritten Bangla Character and Digit recognition	Apr 27, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
A Tool for Facilitating OCR Postediting in Historical Documents	Apr 23, 2020	Language ModelingLanguage Modelling	CodeCode Available
Image Processing Based Scene-Text Detection and Recognition with Tesseract	Apr 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Object Detection and Recognition of Swap-Bodies using Camera mounted on a Vehicle	Apr 17, 2020	Data Augmentationobject-detection	—Unverified
An Evaluation of DNN Architectures for Page Segmentation of Historical Newspapers	Apr 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Sparse Concept Coded Tetrolet Transform for Unconstrained Odia Character Recognition	Apr 3, 2020	Optical Character Recognition (OCR)	—Unverified
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks	Mar 27, 2020	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Real-time information retrieval from Identity cards	Mar 26, 2020	Face DetectionInformation Retrieval	—Unverified
TextCaps: a Dataset for Image Captioning with Reading Comprehension	Mar 24, 2020	Image CaptioningOptical Character Recognition	—Unverified
Confronting the Constraints for Optical Character Segmentation from Printed Bangla Text Image	Mar 18, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Multistage Curvilinear Coordinate Transform Based Document Image Dewarping using a Novel Quality Estimator	Mar 15, 2020	Optical Character Recognition (OCR)	—Unverified
Investigating the Decoders of Maximum Likelihood Sequence Models: A Look-ahead Approach	Mar 8, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep Learning	Feb 23, 2020	ArticlesDeep Learning	CodeCode Available
Attacking Optical Character Recognition (OCR) Systems with Adversarial Watermarks	Feb 8, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Plague Dot Text: Text mining and annotation of outbreak reports of the Third Plague Pandemic (1894-1952)	Feb 4, 2020	EpidemiologyOptical Character Recognition	—Unverified
Pseudo-Bidirectional Decoding for Local Sequence Transduction	Jan 31, 2020	DecoderGrammatical Error Correction	—Unverified
Table Structure Extraction with Bi-directional Gated Recurrent Unit Networks	Jan 8, 2020	document understandingOptical Character Recognition	—Unverified
Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)	Jan 1, 2020	ArticlesOptical Character Recognition	—Unverified
DDI-100: Dataset for Text Detection and Recognition	Dec 25, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Evaluating Usage of Images for App Classification	Dec 16, 2019	ClassificationGeneral Classification	—Unverified
Indiscapes: Instance Segmentation Networks for Layout Parsing of Historical Indic Manuscripts	Dec 15, 2019	DiversityInstance Segmentation	CodeCode Available
Visual Summarization of Scholarly Videos using Word Embeddings and Keyphrase Extraction	Nov 25, 2019	Keyphrase ExtractionOptical Character Recognition	—Unverified
Cascaded Detail-Preserving Networks for Super-Resolution of Document Images	Nov 25, 2019	Image Super-ResolutionOptical Character Recognition (OCR)	—Unverified
Handwritten and Machine printed OCR for Geez Numbers Using Artificial Neural Network	Nov 15, 2019	Image RetrievalOptical Character Recognition (OCR)	—Unverified
Character Keypoint-based Homography Estimation in Scanned Documents for Efficient Information Extraction	Nov 14, 2019	Homography EstimationOptical Character Recognition	—Unverified
Vehicle-Rear: A New Dataset to Explore Feature Fusion for Vehicle Identification Using Convolutional Neural Networks	Nov 13, 2019	Fine-Grained Vehicle ClassificationLicense Plate Detection	CodeCode Available
Recognition of Images of Korean Characters Using Embedded Networks	Nov 11, 2019	Optical Character Recognition (OCR)	—Unverified
Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory	Nov 5, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
VASTA: A Vision and Language-assisted Smartphone Task Automation System	Nov 4, 2019	ClusteringNatural Language Understanding	—Unverified
BIOfid Dataset: Publishing a German Gold Standard for Named Entity Recognition in Historical Biodiversity Literature	Nov 1, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified
DeepErase: Weakly Supervised Ink Artifact Removal in Document Text Images	Oct 15, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
From the Paft to the Fiiture: a Fully Automatic NMT and Word Embeddings Method for OCR Post-Correction	Oct 12, 2019	BIG-bench Machine LearningMachine Translation	CodeCode Available
Rosetta: Large scale system for text detection and recognition in images	Oct 11, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Membership Model Inversion Attacks for Deep Networks	Oct 9, 2019	modelOptical Character Recognition (OCR)	—Unverified
MIDV-2019: Challenges of the modern mobile-based document OCR	Oct 9, 2019	Face DetectionOptical Character Recognition (OCR)	CodeCode Available
Parallel Iterative Edit Models for Local Sequence Transduction	Oct 7, 2019	DecoderGrammatical Error Correction	CodeCode Available
NASS-AI: Towards Digitization of Parliamentary Bills using Document Level Embedding and Bidirectional Long Short-Term Memory	Oct 2, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regression Networks	Oct 1, 2019	3D geometryLocal Distortion	CodeCode Available
Multi-modal Page Stream Segmentation with Convolutional Neural Networks	Sep 27, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available

Show:10 25 50

← PrevPage 18 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified