Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1209 papers

Title	Date	Tasks	Status
User-Centric Evaluation of OCR Systems for Kwak'wala	Feb 26, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Using SMT for OCR Error Correction of Historical Texts	May 1, 2016	ArticlesLanguage Modelling	—Unverified
uTHCD: A New Benchmarking for Tamil Handwritten OCR	Mar 13, 2021	BenchmarkingOptical Character Recognition (OCR)	—Unverified
VARCO-VISION: Expanding Frontiers in Korean Vision-Language Models	Nov 28, 2024	Language ModelingLanguage Modelling	—Unverified
Vartani Spellcheck -- Automatic Context-Sensitive Spelling Correction of OCR-generated Hindi Text Using BERT and Levenshtein Distance	Dec 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
VASTA: A Vision and Language-assisted Smartphone Task Automation System	Nov 4, 2019	ClusteringNatural Language Understanding	—Unverified
Verb Mirage: Unveiling and Assessing Verb Concept Hallucinations in Multimodal Large Language Models	Dec 6, 2024	HallucinationOptical Character Recognition (OCR)	—Unverified
Veri-Car: Towards Open-world Vehicle Information Retrieval	Nov 11, 2024	Information RetrievalLicense Plate Detection	—Unverified
VILA^2: VILA Augmented VILA	Jul 24, 2024	HallucinationOptical Character Recognition (OCR)	—Unverified
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese	Aug 22, 2024	Language ModelingLanguage Modelling	—Unverified
VisBuddy -- A Smart Wearable Assistant for the Visually Challenged	Aug 17, 2021	Image Captioningobject-detection	—Unverified
Vision Grid Transformer for Document Layout Analysis	Aug 29, 2023	Document AIDocument Layout Analysis	—Unverified
Vision Language Models for Spreadsheet Understanding: Challenges and Opportunities	May 25, 2024	Boundary DetectionOptical Character Recognition	—Unverified
VISTA-OCR: Towards generative and interactive end to end OCR models	Apr 4, 2025	DecoderOptical Character Recognition (OCR)	—Unverified
Visual Subtitle Feature Enhanced Video Outline Generation	Aug 24, 2022	ArticlesHeadline Generation	—Unverified
Visual Summarization of Scholarly Videos using Word Embeddings and Keyphrase Extraction	Nov 25, 2019	Keyphrase ExtractionOptical Character Recognition	—Unverified
Visual Zero-Shot E-Commerce Product Attribute Value Extraction	Feb 21, 2025	Aspect ExtractionAttribute	—Unverified
Volume Regularization for Binary Classification	Dec 1, 2012	Binary ClassificationClassification	—Unverified
VORTEX: A Spatial Computing Framework for Optimized Drone Telemetry Extraction from First-Person View Flight Data	Dec 24, 2024	Computational EfficiencyOptical Character Recognition	—Unverified
Vulnerability Analysis of Transformer-based Optical Character Recognition to Adversarial Attacks	Nov 28, 2023	Adversarial AttackOptical Character Recognition	—Unverified
Weakly Supervised Construction of ASR Systems with Massive Video Data	Aug 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weakly supervised information extraction from inscrutable handwritten document images	Jun 12, 2023	Language ModelingLanguage Modelling	—Unverified
We Live in a Motorized Civilization: Robert Moses Replies to Robert Caro	Mar 26, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Training BERT Models to Carry Over a Coding System Developed on One Corpus to Another	Aug 7, 2023	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
What Large Language Models Bring to Text-rich VQA?	Nov 13, 2023	Image ComprehensionOptical Character Recognition (OCR)	—Unverified
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified
What Media Frames Reveal About Stance: A Dataset and Study about Memes in Climate Change Discourse	May 22, 2025	Optical Character Recognition (OCR)Stance Detection	—Unverified
Words as Geometric Features: Estimating Homography using Optical Character Recognition as Compressed Image Representation	May 25, 2025	Anomaly DetectionHomography Estimation	—Unverified
Word Searching in Scene Image and Video Frame in Multi-Script Scenario using Dynamic Shape Coding	Aug 18, 2017	Keyword SpottingOptical Character Recognition (OCR)	—Unverified
Word Segmentation from Unconstrained Handwritten Bangla Document Images using Distance Transform	Sep 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
You’ve translated it, now what?	Sep 1, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified
An Ensemble of Neural Networks for Non-Linear Segmentation of Overlapped Cursive Script	Apr 7, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Zero-Shot Learning Based Approach For Medieval Word Recognition Using Deep-Learned Features	Oct 1, 2018	AttributeGeneralized Zero-Shot Learning	—Unverified
1 Million Captioned Dutch Newspaper Images	May 1, 2016	ArticlesData-to-Text Generation	—Unverified
Towards Self-Improvement of Diffusion Models via Group Preference Optimization	May 16, 2025	Optical Character Recognition (OCR)	—Unverified
3D Rendering Framework for Data Augmentation in Optical Character Recognition	Sep 27, 2022	Data AugmentationOptical Character Recognition	—Unverified
A Black-Box Attack on Optical Character Recognition Systems	Aug 30, 2022	Adversarial AttackBinarization	—Unverified
A BLSTM Network for Printed Bengali OCR System with High Accuracy	Aug 23, 2019	Optical Character Recognition (OCR)Vocal Bursts Intensity Prediction	—Unverified
Abstractive Information Extraction from Scanned Invoices (AIESI) using End-to-end Sequential Approach	Sep 12, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Classical Approach to Handcrafted Feature Extraction Techniques for Bangla Handwritten Digit Recognition	Jan 25, 2022	Handwritten Digit RecognitionOptical Character Recognition (OCR)	—Unverified
A comparative analysis of SRGAN models	Jul 18, 2023	Generative Adversarial NetworkImage Super-Resolution	—Unverified
A Comparative Study of Filtering Approaches Applied to Color Archival Document Images	Aug 16, 2019	DenoisingImage Enhancement	—Unverified
A Compositional Textual Model for Recognition of Imperfect Word Images	Nov 27, 2018	Optical Character Recognition (OCR)Printed Text Recognition	—Unverified
A Conglomerate of Multiple OCR Table Detection and Extraction	Oct 16, 2020	Optical Character Recognition (OCR)Table Detection	—Unverified
A Cost Efficient Approach to Correct OCR Errors in Large Document Collections	May 28, 2019	ClusteringLanguage Modelling	—Unverified
Adapting Multilingual Embedding Models to Historical Luxembourgish	Feb 11, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
A Diachronic Corpus for Romanian (RoDia)	Sep 1, 2017	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Ad Lingua: Text Classification Improves Symbolism Prediction in Image Advertisements	Dec 1, 2020	Language ModelingLanguage Modelling	—Unverified
A document processing pipeline for the construction of a dataset for topic modeling based on the judgments of the Italian Supreme Court	May 13, 2025	DiversityDocument Layout Analysis	—Unverified
Advanced ingestion process powered by LLM parsing for RAG system	Dec 16, 2024	Optical Character Recognition (OCR)RAG	—Unverified

Show:10 25 50

← PrevPage 16 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified