Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1209 papers

Title	Date	Tasks	Status	Hype
Robust Text CAPTCHAs Using Adversarial Examples	Jan 7, 2021	Adversarial AttackOptical Character Recognition (OCR)	—Unverified	0
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified	0
End-to-End Piece-Wise Unwarping of Document Images	Jan 1, 2021	MS-SSIMOptical Character Recognition (OCR)	—Unverified	0
Iranis: A Large-scale Dataset of Farsi License Plate Characters	Jan 1, 2021	image-classificationImage Classification	CodeCode Available	1
NOSE Augment: Fast and Effective Data Augmentation Without Searching	Jan 1, 2021	Data AugmentationDiversity	—Unverified	0
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified	0
ConvMath: A Convolutional Sequence Network for Mathematical Expression Recognition	Dec 23, 2020	DecoderOptical Character Recognition	—Unverified	0
Named Entity Recognition in the Legal Domain using a Pointer Generator Network	Dec 17, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Indonesian ID Card Extractor Using Optical Character Recognition and Natural Language Post-Processing	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
FAWA: Fast Adversarial Watermark Attack on Optical Character Recognition (OCR) Systems	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Discovering Airline-Specific Business Intelligence from Online Passenger Reviews: An Unsupervised Text Analytics Approach	Dec 14, 2020	Opinion MiningOptical Character Recognition (OCR)	—Unverified	0
Vartani Spellcheck -- Automatic Context-Sensitive Spelling Correction of OCR-generated Hindi Text Using BERT and Levenshtein Distance	Dec 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps	Dec 9, 2020	DecoderImage Captioning	—Unverified	0
TAP: Text-Aware Pre-training for Text-VQA and Text-Caption	Dec 8, 2020	Caption GenerationLanguage Modeling	CodeCode Available	1
Confidence-aware Non-repetitive Multimodal Transformers for TextCaps	Dec 7, 2020	Image CaptioningOptical Character Recognition	CodeCode Available	1
A Two-Step Approach for Automatic OCR Post-Correction	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Detecting de minimis Code-Switching in Historical German Books	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Ad Lingua: Text Classification Improves Symbolism Prediction in Image Advertisements	Dec 1, 2020	Language ModelingLanguage Modelling	—Unverified	0
Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia)	Dec 1, 2020	Optical Character Recognition (OCR)POS	CodeCode Available	0
BennettNLP at SemEval-2020 Task 8: Multimodal sentiment classification Using Hybrid Hierarchical Classifier	Dec 1, 2020	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified	0
CSECU\_KDE\_MA at SemEval-2020 Task 8: A Neural Attention Model for Memotion Analysis	Dec 1, 2020	Optical Character Recognition (OCR)	—Unverified	0
SIS@IIITH at SemEval-2020 Task 8: An Overview of Simple Text Classification Methods for Meme Analysis	Dec 1, 2020	ClassificationOptical Character Recognition (OCR)	—Unverified	0
Intrinsic Decomposition of Document Images In-the-Wild	Nov 29, 2020	Document Shadow RemovalIntrinsic Image Decomposition	CodeCode Available	1
A Survey of Deep Learning Approaches for OCR and Document Understanding	Nov 27, 2020	document understandingOptical Character Recognition (OCR)	CodeCode Available	0
A Panoramic Survey of Natural Language Processing in the Arab World	Nov 25, 2020	Machine TranslationOptical Character Recognition	—Unverified	0
SuperOCR: A Conversion from Optical Character Recognition to Image Captioning	Nov 21, 2020	Image CaptioningLicense Plate Recognition	—Unverified	0
On-Device Text Image Super Resolution	Nov 20, 2020	Cloud ComputingGPU	—Unverified	0
Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts	Nov 18, 2020	Clusteringnamed-entity-recognition	—Unverified	0
On-Device Language Identification of Text in Images using Diacritic Characters	Nov 10, 2020	Language Identificationobject-detection	—Unverified	0
OCR Post Correction for Endangered Language Texts	Nov 10, 2020	Optical Character Recognition (OCR)	CodeCode Available	1
Automated data extraction of bar chart raster images	Nov 9, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
An Unsupervised method for OCR Post-Correction and Spelling Normalisation for Finnish	Nov 6, 2020	Machine TranslationNMT	CodeCode Available	1
Handwriting Classification for the Analysis of Art-Historical Documents	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available	0
Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive	Nov 2, 2020	HTROptical Character Recognition (OCR)	—Unverified	0
OCR, Classification & Machine Translation (OCCAM)	Nov 1, 2020	Classificationimage-classification	—Unverified	0
Chunk-based Chinese Spelling Check with Global Optimization	Nov 1, 2020	global-optimizationOptical Character Recognition	—Unverified	0
Alleviating Digitization Errors in Named Entity Recognition for Historical Documents	Nov 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	0
RUArt: A Novel Text-Centered Solution for Text-Based Visual Question Answering	Oct 24, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Persian Handwritten Digit, Character and Word Recognition Using Deep Learning	Oct 24, 2020	Data AugmentationDeep Learning	—Unverified	0
TLGAN: document Text Localization using Generative Adversarial Nets	Oct 22, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified	0
DE-GAN: A Conditional Generative Adversarial Network for Document Enhancement	Oct 17, 2020	BinarizationDeblurring	CodeCode Available	1
A Conglomerate of Multiple OCR Table Detection and Extraction	Oct 16, 2020	Optical Character Recognition (OCR)Table Detection	—Unverified	0
DocStruct: A Multimodal Method to Extract Hierarchy Structure in Document for General Form Understanding	Oct 15, 2020	FormOptical Character Recognition (OCR)	—Unverified	0
Tokenization Repair in the Presence of Spelling Errors	Oct 15, 2020	Optical Character Recognition (OCR)Spelling Correction	CodeCode Available	1
Table Structure Recognition using Top-Down and Bottom-Up Cues	Oct 9, 2020	Cell DetectionOptical Character Recognition	CodeCode Available	1
Finding the Evidence: Localization-aware Answer Prediction for Text Visual Question Answering	Oct 6, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Large Multi-Target Dataset of Common Bengali Handwritten Graphemes	Oct 1, 2020	Multi-Label ClassificationOptical Character Recognition	CodeCode Available	1
Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition	Sep 23, 2020	DecoderOptical Character Recognition (OCR)	—Unverified	0
Towards Image-based Automatic Meter Reading in Unconstrained Scenarios: A Robust and Efficient Approach	Sep 21, 2020	Image-based Automatic Meter ReadingMeter Reading	—Unverified	0

Show:10 25 50

← PrevPage 16 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified