Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–775 of 1209 papers

Title	Date	Tasks	Status
A Simple and Practical Approach to Improve Misspellings in OCR Text	Jun 22, 2021	Optical Character Recognition (OCR)	—Unverified
An End-to-End Khmer Optical Character Recognition using Sequence-to-Sequence with Attention	Jun 21, 2021	DecoderOptical Character Recognition	—Unverified
Tag, Copy or Predict: A Unified Weakly-Supervised Learning Framework for Visual Information Extraction using Sequences	Jun 20, 2021	DecoderOptical Character Recognition	—Unverified
Improving OCR-Based Image Captioning by Incorporating Geometrical Relationship	Jun 19, 2021	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Scene Text Telescope: Text-Focused Scene Image Super-Resolution	Jun 19, 2021	Image Super-ResolutionOptical Character Recognition (OCR)	CodeCode Available
Mixed Model OCR Training on Historical Latin Script for Out-of-the-Box Recognition and Finetuning	Jun 15, 2021	Data AugmentationOptical Character Recognition	—Unverified
Classification of Documents Extracted from Images with Optical Character Recognition Methods	Jun 15, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Context-Free TextSpotter for Real-Time and Mobile End-to-End Text Detection and Recognition	Jun 10, 2021	GPUOptical Character Recognition (OCR)	—Unverified
Classification of Contract-Amendment Relationships	Jun 8, 2021	ClassificationManagement	—Unverified
PAM: Understanding Product Images in Cross Product Category Attribute Extraction	Jun 8, 2021	AttributeAttribute Extraction	—Unverified
Toward Creation of Ancash Lexical Resources from OCR	Jun 1, 2021	Optical Character Recognition (OCR)	—Unverified
Bangla Natural Language Processing: A Comprehensive Analysis of Classical, Machine Learning, and Deep Learning Based Methods	May 31, 2021	ArticlesBIG-bench Machine Learning	—Unverified
A Full-Stack Search Technique for Domain Optimized Deep Learning Accelerators	May 26, 2021	Optical Character Recognition (OCR)Scheduling	—Unverified
Empirical Error Modeling Improves Robustness of Noisy Neural Sequence Labeling	May 25, 2021	Language ModelingLanguage Modelling	CodeCode Available
Simple Transparent Adversarial Examples	May 20, 2021	Image Generationobject-detection	—Unverified
End-to-End Unsupervised Document Image Blind Denoising	May 19, 2021	DenoisingImage Denoising	—Unverified
STRIDE : Scene Text Recognition In-Device	May 17, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Reciprocal Feature Learning via Explicit and Implicit Tasks in Scene Text Recognition	May 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active Learning	May 12, 2021	Active LearningOptical Character Recognition	—Unverified
TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text	May 12, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
GroupLink: An End-to-end Multitask Method for Word Grouping and Relation Extraction in Form Understanding	May 10, 2021	FormOptical Character Recognition (OCR)	—Unverified
An end-to-end Optical Character Recognition approach for ultra-low-resolution printed text images	May 10, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
End-to-End Optical Character Recognition for Bengali Handwritten Words	May 9, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Word-Level Alignment of Paper Documents with their Electronic Full-Text Counterparts	Apr 30, 2021	Optical Character Recognition (OCR)	CodeCode Available
Analyzing Green View Index and Green View Index best path using Google Street View and deep learning	Apr 26, 2021	Optical Character Recognition (OCR)Semantic Segmentation	CodeCode Available

Show:10 25 50

← PrevPage 31 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified