Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–575 of 1209 papers

Title	Date	Tasks	Status	Hype
A Masked Bounding-Box Selection Based ResNet Predictor for Text Rotation Prediction	Sep 6, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
You’ve translated it, now what?	Sep 1, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified	0
A Black-Box Attack on Optical Character Recognition Systems	Aug 30, 2022	Adversarial AttackBinarization	—Unverified	0
An Energy Activity Dataset for Smart Homes	Aug 29, 2022	DiversityMiscellaneous	—Unverified	0
AiM: Taking Answers in Mind to Correct Chinese Cloze Tests in Educational Applications	Aug 26, 2022	Optical Character Recognition (OCR)	CodeCode Available	0
Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages	Aug 26, 2022	DiversityOptical Character Recognition (OCR)	—Unverified	0
Visual Subtitle Feature Enhanced Video Outline Generation	Aug 24, 2022	ArticlesHeadline Generation	—Unverified	0
Graph Neural Networks and Representation Embedding for Table Extraction in PDF Documents	Aug 23, 2022	Optical Character Recognition (OCR)Table Extraction	CodeCode Available	1
An End-to-End OCR Framework for Robust Arabic-Handwriting Recognition using a Novel Transformers-based Model and an Innovative 270 Million-Words Multi-Font Corpus of Classical Arabic with Diacritics	Aug 20, 2022	DecoderHandwriting Recognition	—Unverified	0
To show or not to show: Redacting sensitive text from videos of electronic displays	Aug 19, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Character decomposition to resolve class imbalance problem in Hangul OCR	Aug 12, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Information Extraction from Scanned Invoice Images using Text Analysis and Layout Features	Aug 8, 2022	Optical Character Recognition (OCR)	—Unverified	0
Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning	Jul 25, 2022	Domain AdaptationOptical Character Recognition (OCR)	—Unverified	0
Marior: Margin Removal and Iterative Content Rectification for Document Dewarping in the Wild	Jul 23, 2022	Optical Character Recognition (OCR)	CodeCode Available	1
When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition	Jul 23, 2022	DecoderHandwritten Mathmatical Expression Recognition	CodeCode Available	2
You Actually Look Twice At it (YALTAi): using an object detection approach instead of region segmentation within the Kraken engine	Jul 19, 2022	Classificationobject-detection	CodeCode Available	1
Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting	Jul 14, 2022	global-optimizationKnowledge Distillation	—Unverified	0
DEXTER: An end-to-end system to extract table contents from electronic medical health documents	Jul 14, 2022	Cell DetectionOptical Character Recognition (OCR)	—Unverified	0
DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding	Jul 14, 2022	document understandingOptical Character Recognition (OCR)	—Unverified	0
GMN: Generative Multi-modal Network for Practical Document Information Extraction	Jul 11, 2022	Optical Character Recognition (OCR)	—Unverified	0
Towards Multimodal Vision-Language Models Generating Non-Generic Text	Jul 9, 2022	DescriptiveOptical Character Recognition	—Unverified	0
Detection of Furigana Text in Images	Jul 8, 2022	object-detectionObject Detection	CodeCode Available	1
BusiNet -- a Light and Fast Text Detection Network for Business Documents	Jul 4, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Sequence-aware multimodal page classification of Brazilian legal documents	Jul 2, 2022	ClassificationManagement	CodeCode Available	0
Challenging America: Modeling language in longer time scales	Jul 1, 2022	Cloze TestOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 23 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified