Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 1209 papers

Title	Date	Tasks	Status
Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts	Nov 18, 2020	Clusteringnamed-entity-recognition	—Unverified
Align Me: A framework to generate Parallel Corpus Using OCRs and Bilingual Dictionaries	Dec 1, 2016	Active LearningInformation Retrieval	—Unverified
Chart-RCNN: Efficient Line Chart Data Extraction from Camera Images	Nov 25, 2022	object-detectionObject Detection	—Unverified
CMUQ@QALB-2014: An SMT-based System for Automatic Arabic Error Correction	Oct 1, 2014	Language ModellingMachine Translation	—Unverified
Arabic Character Segmentation Using Projection Based Approach with Profile's Amplitude Filter	Jul 4, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ChartParser: Automatic Chart Parsing for Print-Impaired	Nov 16, 2022	Optical Character Recognition (OCR)	—Unverified
ChartMind: A Comprehensive Benchmark for Complex Real-world Multimodal Chart Question Answering	May 29, 2025	Chart Question AnsweringChart Understanding	—Unverified
A Proposal of Automatic Error Correction in Text	Sep 24, 2021	Information RetrievalLanguage Modelling	—Unverified
A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail	Oct 26, 2022	CPUOptical Character Recognition	—Unverified
ChartEye: A Deep Learning Framework for Chart Information Extraction	Aug 28, 2024	Chart UnderstandingClassification	—Unverified
Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs	Mar 19, 2024	Chart Question AnsweringOptical Character Recognition (OCR)	—Unverified
A preliminary study on similarity-preserving digital book identifiers	Jul 1, 2015	Optical Character Recognition (OCR)	—Unverified
Chargrid-OCR: End-to-end trainable Optical Character Recognition through Semantic Segmentation and Object Detection	Sep 14, 2019	GPUobject-detection	—Unverified
Chargrid-OCR: End-to-end Trainable Optical Character Recognition for Printed Documents using Instance Segmentation	Sep 10, 2019	GPUInstance Segmentation	—Unverified
Applying BLAST to Text Reuse Detection in Finnish Newspapers and Journals, 1771-1910	May 1, 2017	Optical Character Recognition (OCR)	—Unverified
A Black-Box Attack on Optical Character Recognition Systems	Aug 30, 2022	Adversarial AttackBinarization	—Unverified
DocVLM: Make Your VLM an Efficient Reader	Dec 11, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Character Keypoint-based Homography Estimation in Scanned Documents for Efficient Information Extraction	Nov 14, 2019	Homography EstimationOptical Character Recognition	—Unverified
A Possibilistic Approach for Automatic Word Sense Disambiguation	Sep 1, 2012	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer	Apr 19, 2024	DecoderOptical Character Recognition	—Unverified
A Panoramic Survey of Natural Language Processing in the Arab World	Nov 25, 2020	Machine TranslationOptical Character Recognition	—Unverified
Challenging America: Modeling language in longer time scales	Jul 1, 2022	Cloze TestOptical Character Recognition (OCR)	—Unverified
A Language Modelling Approach to Quality Assessment of OCR’ed Historical Text	Jun 1, 2022	Language ModelingLanguage Modelling	—Unverified
DocBed: A Multi-Stage OCR Solution for Documents with Complex Layouts	Feb 3, 2022	ArticlesDocument Layout Analysis	—Unverified
Challenging America: Modeling language in longer time scales	Dec 17, 2021	Cloze TestOptical Character Recognition (OCR)	—Unverified
CG-DIQA: No-reference Document Image Quality Assessment Based on Character Gradient	Jul 11, 2018	Document Image Quality AssessmentImage Quality Assessment	—Unverified
Adapting Multilingual Embedding Models to Historical Luxembourgish	Feb 11, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy	Dec 3, 2024	HallucinationKey Information Extraction	—Unverified
A Cost Efficient Approach to Correct OCR Errors in Large Document Collections	May 28, 2019	ClusteringLanguage Modelling	—Unverified
Categorizing ancient documents	Aug 28, 2013	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified
AI Adoption to Combat Financial Crime: Study on Natural Language Processing in Adverse Media Screening of Financial Services in English and Bangla multilingual interpretation	Dec 12, 2024	Optical Character Recognition (OCR)	—Unverified
DisinfoMeme: A Multimodal Dataset for Detecting Meme Intentionally Spreading Out Disinformation	May 25, 2022	Multimodal ReasoningOptical Character Recognition (OCR)	—Unverified
Cascaded Detail-Preserving Networks for Super-Resolution of Document Images	Nov 25, 2019	Image Super-ResolutionOptical Character Recognition (OCR)	—Unverified
Can You Read Me Now? Content Aware Rectification using Angle Supervision	Aug 5, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
AI-Driven Multi-Stage Computer Vision System for Defect Detection in Laser-Engraved Industrial Nameplates	Mar 5, 2025	Anomaly DetectionDefect Detection	—Unverified
Can Visual Language Models Replace OCR-Based Visual Question Answering Pipelines in Production? A Case Study in Retail	Aug 28, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CAMIO: A Corpus for OCR in Multiple Languages	Jun 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CalliReader: Contextualizing Chinese Calligraphy via an Embedding-Aligned Vision-Language Model	Mar 9, 2025	HallucinationLanguage Modeling	—Unverified
Callico: a Versatile Open-Source Document Image Annotation Platform	May 2, 2024	Document Layout AnalysisHTR	—Unverified
An Unsupervised and Data-Driven Approach for Spell Checking in Vietnamese OCR-scanned Texts	Apr 1, 2012	Optical Character Recognition (OCR)	—Unverified
Diversified Hidden Markov Models for Sequential Labeling	Apr 5, 2019	DiversityOptical Character Recognition	—Unverified
A Hybrid Defense Method against Adversarial Attacks on Traffic Sign Classifiers in Autonomous Vehicles	Apr 25, 2022	Autonomous VehiclesNavigate	—Unverified
A Hybrid Swarm and Gravitation based feature selection algorithm for Handwritten Indic Script Classification problem	May 10, 2020	Classificationfeature selection	—Unverified
Directional Global Three-part Image Decomposition	Oct 6, 2015	Image CompressionOptical Character Recognition	—Unverified
Bypassing Captcha By Machine A Proof For Passing The Turing Test	Sep 3, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
BusiNet -- a Light and Fast Text Detection Network for Business Documents	Jul 4, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Novel Transfer Learning Approach upon Hindi, Arabic, and Bangla Numerals using Convolutional Neural Networks	Jul 26, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Discovering Airline-Specific Business Intelligence from Online Passenger Reviews: An Unsupervised Text Analytics Approach	Dec 14, 2020	Opinion MiningOptical Character Recognition (OCR)	—Unverified
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
A Novel Pipeline for Improving Optical Character Recognition through Post-processing Using Natural Language Processing	Jul 9, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 6 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified