Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1209 papers

Title	Date	Tasks	Status	Hype
A Masked Bounding-Box Selection Based ResNet Predictor for Text Rotation Prediction	Sep 6, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
You’ve translated it, now what?	Sep 1, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified	0
A Black-Box Attack on Optical Character Recognition Systems	Aug 30, 2022	Adversarial AttackBinarization	—Unverified	0
An Energy Activity Dataset for Smart Homes	Aug 29, 2022	DiversityMiscellaneous	—Unverified	0
AiM: Taking Answers in Mind to Correct Chinese Cloze Tests in Educational Applications	Aug 26, 2022	Optical Character Recognition (OCR)	CodeCode Available	0
Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages	Aug 26, 2022	DiversityOptical Character Recognition (OCR)	—Unverified	0
Visual Subtitle Feature Enhanced Video Outline Generation	Aug 24, 2022	ArticlesHeadline Generation	—Unverified	0
Graph Neural Networks and Representation Embedding for Table Extraction in PDF Documents	Aug 23, 2022	Optical Character Recognition (OCR)Table Extraction	CodeCode Available	1
An End-to-End OCR Framework for Robust Arabic-Handwriting Recognition using a Novel Transformers-based Model and an Innovative 270 Million-Words Multi-Font Corpus of Classical Arabic with Diacritics	Aug 20, 2022	DecoderHandwriting Recognition	—Unverified	0
To show or not to show: Redacting sensitive text from videos of electronic displays	Aug 19, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Character decomposition to resolve class imbalance problem in Hangul OCR	Aug 12, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Information Extraction from Scanned Invoice Images using Text Analysis and Layout Features	Aug 8, 2022	Optical Character Recognition (OCR)	—Unverified	0
Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning	Jul 25, 2022	Domain AdaptationOptical Character Recognition (OCR)	—Unverified	0
When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition	Jul 23, 2022	DecoderHandwritten Mathmatical Expression Recognition	CodeCode Available	2
Marior: Margin Removal and Iterative Content Rectification for Document Dewarping in the Wild	Jul 23, 2022	Optical Character Recognition (OCR)	CodeCode Available	1
You Actually Look Twice At it (YALTAi): using an object detection approach instead of region segmentation within the Kraken engine	Jul 19, 2022	Classificationobject-detection	CodeCode Available	1
Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting	Jul 14, 2022	global-optimizationKnowledge Distillation	—Unverified	0
DEXTER: An end-to-end system to extract table contents from electronic medical health documents	Jul 14, 2022	Cell DetectionOptical Character Recognition (OCR)	—Unverified	0
DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding	Jul 14, 2022	document understandingOptical Character Recognition (OCR)	—Unverified	0
GMN: Generative Multi-modal Network for Practical Document Information Extraction	Jul 11, 2022	Optical Character Recognition (OCR)	—Unverified	0
Towards Multimodal Vision-Language Models Generating Non-Generic Text	Jul 9, 2022	DescriptiveOptical Character Recognition	—Unverified	0
Detection of Furigana Text in Images	Jul 8, 2022	object-detectionObject Detection	CodeCode Available	1
BusiNet -- a Light and Fast Text Detection Network for Business Documents	Jul 4, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Sequence-aware multimodal page classification of Brazilian legal documents	Jul 2, 2022	ClassificationManagement	CodeCode Available	0
Challenging America: Modeling language in longer time scales	Jul 1, 2022	Cloze TestOptical Character Recognition (OCR)	—Unverified	0
Multistep Automated Data Labelling Procedure (MADLaP) for Thyroid Nodules on Ultrasound: An Artificial Intelligence Approach for Automating Image Annotation	Jun 28, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
iExam: A Novel Online Exam Monitoring and Analysis System Based on Face Detection and Recognition	Jun 27, 2022	Face DetectionFace Recognition	CodeCode Available	0
Towards Optimizing OCR for Accessibility	Jun 21, 2022	Optical Character Recognition (OCR)text-to-speech	—Unverified	0
Broken News: Making Newspapers Accessible to Print-Impaired	Jun 21, 2022	Instance SegmentationOptical Character Recognition (OCR)	—Unverified	0
RDU: A Region-based Approach to Form-style Document Understanding	Jun 14, 2022	document understandingForm	—Unverified	0
An Evaluation of OCR on Egocentric Data	Jun 11, 2022	Optical Character Recognition (OCR)	CodeCode Available	0
Transformer based Urdu Handwritten Text Optical Character Reader	Jun 9, 2022	Natural Language UnderstandingOptical Character Recognition (OCR)	—Unverified	0
PP-OCRv3: More Attempts for the Improvement of Ultra Lightweight OCR System	Jun 7, 2022	Data AugmentationOptical Character Recognition	—Unverified	0
Contrastive Graph Multimodal Model for Text Classification in Videos	Jun 6, 2022	ClassificationContrastive Learning	—Unverified	0
Two Decades of Bengali Handwritten Digit Recognition: A Survey	Jun 5, 2022	Handwritten Digit RecognitionOptical Character Recognition	—Unverified	0
Introducing One Sided Margin Loss for Solving Classification Problems in Deep Networks	Jun 2, 2022	ClassificationOptical Character Recognition	—Unverified	0
Generating Monolingual Dataset for Low Resource Language Bodo from old books using Google Keep	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified	0
A Language Modelling Approach to Quality Assessment of OCR’ed Historical Text	Jun 1, 2022	Language ModelingLanguage Modelling	—Unverified	0
An Open Source Contractual Language Understanding Application Using Machine Learning	Jun 1, 2022	Document Text ClassificationInformation Retrieval	CodeCode Available	0
Multilingual Named Entity Recognition for Medieval Charters Using Stacked Embeddings and Bert-based Models.	Jun 1, 2022	HTRMultilingual Named Entity Recognition	—Unverified	0
Handwritten Character Generation using Y-Autoencoder for Character Recognition Model Training	Jun 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
CAMIO: A Corpus for OCR in Multiple Languages	Jun 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Between History and Natural Language Processing: Study, Enrichment and Online Publication of French Parliamentary Debates of the Early Third Republic (1881-1899)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified	0
Simulation d’erreurs d’OCR dans les systèmes de TAL pour le traitement de données anachroniques (Simulation of OCR errors in NLP systems for processing anachronistic data)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified	0
Toolbox : une chaîne de traitement de corpus pour les humanités numériques (Toolbox : a corpus processing pipeline for digital humanities)	Jun 1, 2022	HTROptical Character Recognition (OCR)	—Unverified	0
Reconnaissance d’entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique (Resolution of entity linking issues on noisy OCR output : automatic disambiguation tracks)	Jun 1, 2022	Entity LinkingOptical Character Recognition (OCR)	—Unverified	0
MaskOCR: Text Recognition with Masked Encoder-Decoder Pretraining	Jun 1, 2022	DecoderLanguage Modeling	—Unverified	0
Delivering Document Conversion as a Cloud Service with High Throughput and Responsiveness	Jun 1, 2022	CPUdocument understanding	CodeCode Available	2
Optical character recognition quality affects perceived usefulness of historical newspaper clippings	Jun 1, 2022	ArticlesInformation Retrieval	—Unverified	0
hmBERT: Historical Multilingual Language Models for Named Entity Recognition	May 31, 2022	Language ModelingLanguage Modelling	CodeCode Available	1

Show:10 25 50

← PrevPage 12 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified