Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–775 of 1209 papers

Title	Date	Tasks	Status	Hype
Robust Text CAPTCHAs Using Adversarial Examples	Jan 7, 2021	Adversarial AttackOptical Character Recognition (OCR)	—Unverified	0
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified	0
End-to-End Piece-Wise Unwarping of Document Images	Jan 1, 2021	MS-SSIMOptical Character Recognition (OCR)	—Unverified	0
Iranis: A Large-scale Dataset of Farsi License Plate Characters	Jan 1, 2021	image-classificationImage Classification	CodeCode Available	1
NOSE Augment: Fast and Effective Data Augmentation Without Searching	Jan 1, 2021	Data AugmentationDiversity	—Unverified	0
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified	0
ConvMath: A Convolutional Sequence Network for Mathematical Expression Recognition	Dec 23, 2020	DecoderOptical Character Recognition	—Unverified	0
Named Entity Recognition in the Legal Domain using a Pointer Generator Network	Dec 17, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Indonesian ID Card Extractor Using Optical Character Recognition and Natural Language Post-Processing	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
FAWA: Fast Adversarial Watermark Attack on Optical Character Recognition (OCR) Systems	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Discovering Airline-Specific Business Intelligence from Online Passenger Reviews: An Unsupervised Text Analytics Approach	Dec 14, 2020	Opinion MiningOptical Character Recognition (OCR)	—Unverified	0
Vartani Spellcheck -- Automatic Context-Sensitive Spelling Correction of OCR-generated Hindi Text Using BERT and Levenshtein Distance	Dec 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps	Dec 9, 2020	DecoderImage Captioning	—Unverified	0
TAP: Text-Aware Pre-training for Text-VQA and Text-Caption	Dec 8, 2020	Caption GenerationLanguage Modeling	CodeCode Available	1
Confidence-aware Non-repetitive Multimodal Transformers for TextCaps	Dec 7, 2020	Image CaptioningOptical Character Recognition	CodeCode Available	1
A Two-Step Approach for Automatic OCR Post-Correction	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Detecting de minimis Code-Switching in Historical German Books	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Ad Lingua: Text Classification Improves Symbolism Prediction in Image Advertisements	Dec 1, 2020	Language ModelingLanguage Modelling	—Unverified	0
Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia)	Dec 1, 2020	Optical Character Recognition (OCR)POS	CodeCode Available	0
BennettNLP at SemEval-2020 Task 8: Multimodal sentiment classification Using Hybrid Hierarchical Classifier	Dec 1, 2020	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified	0
CSECU\_KDE\_MA at SemEval-2020 Task 8: A Neural Attention Model for Memotion Analysis	Dec 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
SIS@IIITH at SemEval-2020 Task 8: An Overview of Simple Text Classification Methods for Meme Analysis	Dec 1, 2020	ClassificationOptical Character Recognition (OCR)	—Unverified	0
Intrinsic Decomposition of Document Images In-the-Wild	Nov 29, 2020	Document Shadow RemovalIntrinsic Image Decomposition	CodeCode Available	1
A Survey of Deep Learning Approaches for OCR and Document Understanding	Nov 27, 2020	document understandingOptical Character Recognition (OCR)	CodeCode Available	0
A Panoramic Survey of Natural Language Processing in the Arab World	Nov 25, 2020	Machine TranslationOptical Character Recognition	—Unverified	0

Show:10 25 50

← PrevPage 31 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified