Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 676–700 of 1209 papers

Title	Date	Tasks	Status	Hype
PP-OCRv2: Bag of Tricks for Ultra Lightweight OCR System	Sep 7, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	2
A Novel Machine Learning Based Approach for Post-OCR Error Detection	Sep 1, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
OCR Processing of Swedish Historical Newspapers Using Deep Hybrid CNN–LSTM Networks	Sep 1, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Multimodal Framework for Video Ads Understanding	Aug 29, 2021	MarketingOptical Character Recognition	—Unverified	0
LayoutReader: Pre-training of Text and Layout for Reading Order Detection	Aug 26, 2021	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified	0
EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQA	Aug 22, 2021	Open-Ended Question AnsweringOptical Character Recognition (OCR)	—Unverified	0
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified	0
Real-time Bangla License Plate Recognition System for Low Resource Video-based Applications	Aug 18, 2021	License Plate RecognitionOptical Character Recognition (OCR)	—Unverified	0
VisBuddy -- A Smart Wearable Assistant for the Visually Challenged	Aug 17, 2021	Image Captioningobject-detection	—Unverified	0
MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding	Aug 14, 2021	Key Information Extractionnamed-entity-recognition	—Unverified	0
BROS: A Pre-trained Language Model Focusing on Text and Layout for Better Key Information Extraction from Documents	Aug 10, 2021	Key Information ExtractionLanguage Modeling	CodeCode Available	1
Lights, Camera, Action! A Framework to Improve NLP Accuracy over OCR documents	Aug 6, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
The Corpora They Are a-Changing: a Case Study in Italian Newspapers	Aug 1, 2021	Optical Character Recognition (OCR)	—Unverified	0
MinD at SemEval-2021 Task 6: Propaganda Detection using Transfer Learning and Multimodal Fusion	Aug 1, 2021	Optical Character Recognition (OCR)Propaganda detection	—Unverified	0
Robust Learning for Text Classification with Multi-source Noise Simulation and Hard Example Mining	Jul 15, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Scene Text recognition with Full Normalization	Jul 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified	0
Memes in the Wild: Assessing the Generalizability of the Hateful Memes Challenge Dataset	Jul 9, 2021	Optical Character Recognition (OCR)	—Unverified	0
Data Centric Domain Adaptation for Historical Text with OCR Errors	Jul 2, 2021	Cross-Domain Named Entity RecognitionDomain Adaptation	CodeCode Available	0
Automatic Metadata Extraction Incorporating Visual Features from Scanned Electronic Theses and Dissertations	Jul 1, 2021	Key Information ExtractionOptical Character Recognition (OCR)	CodeCode Available	0
SAR-Net: Shape Alignment and Recovery Network for Category-level 6D Object Pose and Size Estimation	Jun 27, 2021	ObjectOptical Character Recognition (OCR)	—Unverified	0
A Simple and Practical Approach to Improve Misspellings in OCR Text	Jun 22, 2021	Optical Character Recognition (OCR)	—Unverified	0
An End-to-End Khmer Optical Character Recognition using Sequence-to-Sequence with Attention	Jun 21, 2021	DecoderOptical Character Recognition	—Unverified	0
Tag, Copy or Predict: A Unified Weakly-Supervised Learning Framework for Visual Information Extraction using Sequences	Jun 20, 2021	DecoderOptical Character Recognition	—Unverified	0
Scene Text Telescope: Text-Focused Scene Image Super-Resolution	Jun 19, 2021	Image Super-ResolutionOptical Character Recognition (OCR)	CodeCode Available	0
Improving OCR-Based Image Captioning by Incorporating Geometrical Relationship	Jun 19, 2021	Image CaptioningOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 28 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified