Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1209 papers

Title	Date	Tasks	Status
D\'etection d'erreurs dans des transcriptions OCR de documents historiques par r\'eseaux de neurones r\'ecurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
Detection Masking for Improved OCR on Noisy Documents	May 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Detection of Text Reuse in French Medical Corpora	Dec 1, 2016	De-identificationOptical Character Recognition (OCR)	—Unverified
Development of a New Image-to-text Conversion System for Pashto, Farsi and Traditional Chinese	May 8, 2020	Image to textOptical Character Recognition (OCR)	—Unverified
Development of a WAZOBIA-Named Entity Recognition System	May 10, 2025	Machine Translationnamed-entity-recognition	—Unverified
DEVICE: DEpth and VIsual ConcEpts Aware Transformer for TextCaps	Feb 3, 2023	Image CaptioningOptical Character Recognition (OCR)	—Unverified
DEXTER: An end-to-end system to extract table contents from electronic medical health documents	Jul 14, 2022	Cell DetectionOptical Character Recognition (OCR)	—Unverified
Digitizing 18th-Century French Literature: Comparing transcription methods for a critical edition text	Jun 1, 2012	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Directional Global Three-part Image Decomposition	Oct 6, 2015	Image CompressionOptical Character Recognition	—Unverified
Discovering Airline-Specific Business Intelligence from Online Passenger Reviews: An Unsupervised Text Analytics Approach	Dec 14, 2020	Opinion MiningOptical Character Recognition (OCR)	—Unverified
Discriminative Dictionary Learning based on Statistical Methods	Nov 17, 2021	DenoisingDictionary Learning	—Unverified
DISGO: Automatic End-to-End Evaluation for Scene Text OCR	Aug 25, 2023	Machine TranslationOptical Character Recognition	—Unverified
DisinfoMeme: A Multimodal Dataset for Detecting Meme Intentionally Spreading Out Disinformation	May 25, 2022	Multimodal ReasoningOptical Character Recognition (OCR)	—Unverified
Diversified Hidden Markov Models for Sequential Labeling	Apr 5, 2019	DiversityOptical Character Recognition	—Unverified
Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer	Apr 19, 2024	DecoderOptical Character Recognition	—Unverified
DocBed: A Multi-Stage OCR Solution for Documents with Complex Layouts	Feb 3, 2022	ArticlesDocument Layout Analysis	—Unverified
DocPedia: Unleashing the Power of Large Multimodal Model in the Frequency Domain for Versatile Document Understanding	Nov 20, 2023	document understandingLanguage Modeling	—Unverified
DocStruct: A Multimodal Method to Extract Hierarchy Structure in Document for General Form Understanding	Oct 15, 2020	FormOptical Character Recognition (OCR)	—Unverified
DocSum: Domain-Adaptive Pre-training for Document Abstractive Summarization	Dec 11, 2024	Abstractive Text SummarizationDecision Making	—Unverified
Document Decomposition of Bangla Printed Text	Jan 27, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Document Enhancement System Using Auto-encoders	Sep 14, 2019	DenoisingDocument Enhancement	—Unverified
Document Image Binarization in JPEG Compressed Domain using Dual Discriminator Generative Adversarial Networks	Sep 13, 2022	BinarizationOptical Character Recognition (OCR)	—Unverified
Document Layout Analysis via Dynamic Residual Feature Fusion	Apr 7, 2021	Document Layout AnalysisOptical Character Recognition	—Unverified
DocVLM: Make Your VLM an Efficient Reader	Dec 11, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond	Oct 19, 2023	Document AIDocument Layout Analysis	—Unverified
SAR-Net: Shape Alignment and Recovery Network for Category-level 6D Object Pose and Size Estimation	Jun 27, 2021	ObjectOptical Character Recognition (OCR)	—Unverified
DONUT-hole: DONUT Sparsification by Harnessing Knowledge and Optimizing Learning Efficiency	Nov 9, 2023	document understandingKey Information Extraction	—Unverified
DoPTA: Improving Document Layout Analysis using Patch-Text Alignment	Dec 17, 2024	Document AIDocument Image Classification	—Unverified
DOTA: Deformable Optimized Transformer Architecture for End-to-End Text Recognition with Retrieval-Augmented Generation	May 7, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
DUBLIN -- Document Understanding By Language-Image Network	May 23, 2023	Document Classificationdocument understanding	—Unverified
Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting	Jul 14, 2022	global-optimizationKnowledge Distillation	—Unverified
Dynamic Programming Approach to Template-based OCR	Dec 19, 2018	Optical Character Recognition (OCR)Position	—Unverified
E2E Process Automation Leveraging Generative AI and IDP-Based Automation Agent: A Case Study on Corporate Expense Processing	May 27, 2025	Decision MakingOptical Character Recognition (OCR)	—Unverified
EASTER: Efficient and Scalable Text Recognizer	Aug 18, 2020	BenchmarkingHandwritten Text Recognition	—Unverified
Éclair -- Extracting Content and Layout with Integrated Reading Order for Documents	Feb 6, 2025	Image CaptioningOptical Character Recognition	—Unverified
Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages	Aug 26, 2022	DiversityOptical Character Recognition (OCR)	—Unverified
Effective search space reduction for spell correction using character neural embeddings	Apr 1, 2017	Optical Character Recognition (OCR)	—Unverified
Efficient End-to-End Visual Document Understanding with Rationale Distillation	Nov 16, 2023	document understandingImage to text	—Unverified
Efficient few-shot learning for pixel-precise handwritten document layout analysis	Oct 27, 2022	Document Layout AnalysisFew-Shot Learning	—Unverified
Efficient, Lexicon-Free OCR using Deep Learning	Jun 5, 2019	Data AugmentationDeep Learning	—Unverified
Efficient Media Retrieval from Non-Cooperative Queries	Nov 19, 2014	Optical Character Recognition (OCR)Retrieval	—Unverified
Efficient Medical VIE via Reinforcement Learning	Jun 16, 2025	DiversityOptical Character Recognition (OCR)	—Unverified
EfficientOCR: An Extensible, Open-Source Package for Efficiently Digitizing World Knowledge	Oct 16, 2023	Image RetrievalLanguage Modeling	—Unverified
Embedding Similarity Guided License Plate Super Resolution	Jan 2, 2025	License Plate RecognitionOptical Character Recognition	—Unverified
Endangered Data for Endangered Languages: Digitizing Print dictionaries	Mar 1, 2017	Optical Character Recognition (OCR)	—Unverified
Real-time Bangla License Plate Recognition System for Low Resource Video-based Applications	Aug 18, 2021	License Plate RecognitionOptical Character Recognition (OCR)	—Unverified
End-to-End Piece-Wise Unwarping of Document Images	Jan 1, 2021	MS-SSIMOptical Character Recognition (OCR)	—Unverified
End-to-End Unsupervised Document Image Blind Denoising	May 19, 2021	DenoisingImage Denoising	—Unverified
Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation	Jun 25, 2025	Optical Character Recognition (OCR)RAG	—Unverified
Enhancement of Bengali OCR by Specialized Models and Advanced Techniques for Diverse Document Types	Feb 7, 2024	Optical Character Recognition (OCR)Table Recognition	—Unverified

Show:10 25 50

← PrevPage 21 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified