Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 1209 papers

Title	Date	Tasks	Status
A Possibilistic Approach for Automatic Word Sense Disambiguation	Sep 1, 2012	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images	Jan 16, 2025	De-identificationOptical Character Recognition	—Unverified
GlyphMastero: A Glyph Encoder for High-Fidelity Scene Text Editing	May 8, 2025	Optical Character Recognition (OCR)Scene Text Editing	—Unverified
GMN: Generative Multi-modal Network for Practical Document Information Extraction	Jul 11, 2022	Optical Character Recognition (OCR)	—Unverified
Exploiter des mod\`eles de langue pour \'evaluer des sorties de logiciels d'OCR pour des documents fran du XVIIe si\`ecle ()	Jun 1, 2020	Optical Character Recognition (OCR)	—Unverified
TextSleuth: Towards Explainable Tampered Text Detection	Dec 19, 2024	Domain GeneralizationOptical Character Recognition (OCR)	—Unverified
Challenging America: Modeling language in longer time scales	Jul 1, 2022	Cloze TestOptical Character Recognition (OCR)	—Unverified
A Panoramic Survey of Natural Language Processing in the Arab World	Nov 25, 2020	Machine TranslationOptical Character Recognition	—Unverified
Grouping Language Model Boundary Words to Speed K--Best Extraction from Hypergraphs	Jun 1, 2013	Language ModelingLanguage Modelling	—Unverified
GroupLink: An End-to-end Multitask Method for Word Grouping and Relation Extraction in Form Understanding	May 10, 2021	FormOptical Character Recognition (OCR)	—Unverified
A Language Modelling Approach to Quality Assessment of OCR’ed Historical Text	Jun 1, 2022	Language ModelingLanguage Modelling	—Unverified
Explainable Publication Year Prediction of Eighteenth Century Texts with the BERT Model	May 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Every Pixel Tells a Story: End-to-End Urdu Newspaper OCR	May 20, 2025	ArticlesImage Super-Resolution	—Unverified
Challenging America: Modeling language in longer time scales	Dec 17, 2021	Cloze TestOptical Character Recognition (OCR)	—Unverified
Evaluating Usage of Images for App Classification	Dec 16, 2019	ClassificationGeneral Classification	—Unverified
CG-DIQA: No-reference Document Image Quality Assessment Based on Character Gradient	Jul 11, 2018	Document Image Quality AssessmentImage Quality Assessment	—Unverified
Evaluating Inter-Annotator Agreement on Historical Spelling Normalization	Aug 1, 2016	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
Evaluating BERT-based Scientific Relation Classifiers for Scholarly Knowledge Graph Construction on Digital Library Collections	May 3, 2023	graph constructionOptical Character Recognition	—Unverified
Estimating Post-OCR Denoising Complexity on Numerical Texts	Jul 3, 2023	DenoisingOptical Character Recognition (OCR)	—Unverified
ERPA: Efficient RPA Model Integrating OCR and LLMs for Intelligent Document Processing	Dec 24, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy	Dec 3, 2024	HallucinationKey Information Extraction	—Unverified
Adapting Multilingual Embedding Models to Historical Luxembourgish	Feb 11, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
EraseNet: A Recurrent Residual Network for Supervised Document Cleaning	Oct 3, 2022	DenoisingOptical Character Recognition	—Unverified
Entropy Heat-Mapping: Localizing GPT-Based OCR Errors with Sliding-Window Shannon Analysis	Apr 30, 2025	Optical Character Recognition (OCR)	—Unverified
Enhancing Vehicle Entrance and Parking Management: Deep Learning Solutions for Efficiency and Security	Dec 5, 2023	Face DetectionLicense Plate Recognition	—Unverified
Enhancing Question Answering on Charts Through Effective Pre-training Tasks	Jun 14, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Categorizing ancient documents	Aug 28, 2013	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified
Enhancing OCR Performance through Post-OCR Models: Adopting Glyph Embedding for Improved Correction	Aug 29, 2023	Optical Character Recognition (OCR)	—Unverified
From Training-Free to Adaptive: Empirical Insights into MLLMs' Understanding of Detection Information	Jan 31, 2024	Hallucinationobject-detection	—Unverified
Cascaded Detail-Preserving Networks for Super-Resolution of Document Images	Nov 25, 2019	Image Super-ResolutionOptical Character Recognition (OCR)	—Unverified
Can You Read Me Now? Content Aware Rectification using Angle Supervision	Aug 5, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
AI-Driven Multi-Stage Computer Vision System for Defect Detection in Laser-Engraved Industrial Nameplates	Mar 5, 2025	Anomaly DetectionDefect Detection	—Unverified
Enhancement of text recognition for hanja handwritten documents of Ancient Korea	Dec 14, 2024	Data Augmentationobject-detection	—Unverified
Enhancement of Bengali OCR by Specialized Models and Advanced Techniques for Diverse Document Types	Feb 7, 2024	Optical Character Recognition (OCR)Table Recognition	—Unverified
Can Visual Language Models Replace OCR-Based Visual Question Answering Pipelines in Production? A Case Study in Retail	Aug 28, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation	Jun 25, 2025	Optical Character Recognition (OCR)RAG	—Unverified
End-to-End Unsupervised Document Image Blind Denoising	May 19, 2021	DenoisingImage Denoising	—Unverified
CAMIO: A Corpus for OCR in Multiple Languages	Jun 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
End-to-End Piece-Wise Unwarping of Document Images	Jan 1, 2021	MS-SSIMOptical Character Recognition (OCR)	—Unverified
CalliReader: Contextualizing Chinese Calligraphy via an Embedding-Aligned Vision-Language Model	Mar 9, 2025	HallucinationLanguage Modeling	—Unverified
Real-time Bangla License Plate Recognition System for Low Resource Video-based Applications	Aug 18, 2021	License Plate RecognitionOptical Character Recognition (OCR)	—Unverified
Callico: a Versatile Open-Source Document Image Annotation Platform	May 2, 2024	Document Layout AnalysisHTR	—Unverified
An Unsupervised and Data-Driven Approach for Spell Checking in Vietnamese OCR-scanned Texts	Apr 1, 2012	Optical Character Recognition (OCR)	—Unverified
AI Adoption to Combat Financial Crime: Study on Natural Language Processing in Adverse Media Screening of Financial Services in English and Bangla multilingual interpretation	Dec 12, 2024	Optical Character Recognition (OCR)	—Unverified
A Cost Efficient Approach to Correct OCR Errors in Large Document Collections	May 28, 2019	ClusteringLanguage Modelling	—Unverified
Endangered Data for Endangered Languages: Digitizing Print dictionaries	Mar 1, 2017	Optical Character Recognition (OCR)	—Unverified
Embedding Similarity Guided License Plate Super Resolution	Jan 2, 2025	License Plate RecognitionOptical Character Recognition	—Unverified
Bypassing Captcha By Machine A Proof For Passing The Turing Test	Sep 3, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
EfficientOCR: An Extensible, Open-Source Package for Efficiently Digitizing World Knowledge	Oct 16, 2023	Image RetrievalLanguage Modeling	—Unverified
BusiNet -- a Light and Fast Text Detection Network for Business Documents	Jul 4, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 11 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified