Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 826–850 of 1209 papers

Title	Date	Tasks	Status	Hype
Tamil Vowel Recognition With Augmented MNIST-like Data Set	Jun 9, 2020	ClassificationGeneral Classification	—Unverified	0
Exploiter des mod\`eles de langue pour \'evaluer des sorties de logiciels d'OCR pour des documents fran du XVIIe si\`ecle ()	Jun 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified	0
Structured Multimodal Attentions for TextVQA	Jun 1, 2020	Graph AttentionOptical Character Recognition (OCR)	CodeCode Available	1
SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition	May 22, 2020	DecoderOptical Character Recognition (OCR)	CodeCode Available	1
NAT: Noise-Aware Training for Robust Neural Sequence Labeling	May 14, 2020	Data Augmentationnamed-entity-recognition	CodeCode Available	1
Large Scale Font Independent Urdu Text Recognition System	May 14, 2020	Incremental LearningOptical Character Recognition (OCR)	CodeCode Available	1
Computer Vision Toolkit for Non-invasive Monitoring of Factory Floor Artifacts	May 12, 2020	Anomaly DetectionContour Detection	—Unverified	0
Quantitative Analysis of Image Classification Techniques for Memory-Constrained Devices	May 11, 2020	ClassificationGeneral Classification	—Unverified	0
Deep Learning Based Vehicle Tracking System Using License Plate Detection And Recognition	May 10, 2020	GPULicense Plate Detection	—Unverified	0
A Hybrid Swarm and Gravitation based feature selection algorithm for Handwritten Indic Script Classification problem	May 10, 2020	Classificationfeature selection	—Unverified	0
Development of a New Image-to-text Conversion System for Pashto, Farsi and Traditional Chinese	May 8, 2020	Image to textOptical Character Recognition (OCR)	—Unverified	0
A Gaussian Process Upsampling Model for Improvements in Optical Character Recognition	May 7, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
The Newspaper Navigator Dataset: Extracting And Analyzing Visual Content from 16 Million Historic Newspaper Pages in Chronicling America	May 4, 2020	Optical Character Recognition (OCR)	CodeCode Available	1
Books of Hours. the First Liturgical Data Set for Text Segmentation.	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified	0
How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified	0
Time-Aware Word Embeddings for Three Lebanese News Archives	May 1, 2020	Optical Character Recognition (OCR)Word Embeddings	CodeCode Available	0
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Constructing a Public Meeting Corpus	May 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
Preserving Semantic Information from Old Dictionaries: Linking Senses of the `Altfranz\"osisches W\"orterbuch' to WordNet	May 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
OdiEnCorp 2.0: Odia-English Parallel Corpus for Machine Translation	May 1, 2020	Machine TranslationNMT	—Unverified	0
MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten Compound Characters	Apr 29, 2020	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Skip-connected Multi-column Network for Isolated Handwritten Bangla Character and Digit recognition	Apr 27, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
A Tool for Facilitating OCR Postediting in Historical Documents	Apr 23, 2020	Language ModelingLanguage Modelling	CodeCode Available	0
Image Processing Based Scene-Text Detection and Recognition with Tesseract	Apr 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 34 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified