Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1209 papers

Title	Date	Tasks	Status
SAML-QC: a Stochastic Assessment and Machine Learning based QC technique for Industrial Printing	Jan 18, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified
SARD: A Large-Scale Synthetic Arabic OCR Dataset for Book-Style Text Recognition	May 30, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents	May 19, 2025	Dataset GenerationOptical Character Recognition (OCR)	—Unverified
Scaling Automatic Extraction of Pseudocode	Jun 7, 2024	Code GenerationOptical Character Recognition	—Unverified
Scatteract: Automated extraction of data from scatter plots	Apr 21, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SceneGATE: Scene-Graph based co-Attention networks for TExt visual question answering	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Scene Text recognition with Full Normalization	Jul 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild	Jan 6, 2025	AttributeOptical Character Recognition	—Unverified
SciCapenter: Supporting Caption Composition for Scientific Figures with Machine-Generated Captions and Ratings	Mar 26, 2024	Optical Character Recognition (OCR)	—Unverified
Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models	Jun 25, 2025	document understandingHallucination	—Unverified
Seeing the Signs: A Survey of Edge-Deployable OCR Models for Billboard Visibility Analysis	Jul 15, 2025	MarketingOptical Character Recognition	—Unverified
See then Tell: Enhancing Key Information Extraction with Vision Grounding	Sep 29, 2024	Image to textKey Information Extraction	—Unverified
SEE: Towards Semi-SupervisedEnd-to-End Scene Text Recognition	Dec 14, 2017	Optical Character Recognition (OCR)Scene Text Detection	—Unverified
Segmentation-free Connectionist Temporal Classification loss based OCR Model for Text Captcha Classification	Feb 8, 2024	CAPTCHA DetectionClassification	—Unverified
Self-paced learning to improve text row detection in historical documents with missing labels	Jan 28, 2022	Missing LabelsOptical Character Recognition	—Unverified
Self-supervised Data Bootstrapping for Deep Optical Character Recognition of Identity Documents	Aug 12, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Semantic rule Web-based Diagnosis and Treatment of Vector-Borne Diseases using SWRL rules	Jan 8, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Semantic Segmentation for Real-World and Synthetic Vehicle's Forward-Facing Camera Images	Jul 7, 2024	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
Semi-automated annotation of page-based documents within the Genre and Multimodality framework	Aug 1, 2016	Optical Character Recognition (OCR)	—Unverified
Semi-Structured Query Grounding for Document-Oriented Databases with Deep Retrieval and Its Application to Receipt and POI Matching	Feb 23, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Sequence-to-Label Script Identification for Multilingual OCR	Aug 15, 2017	Optical Character Recognition (OCR)	—Unverified
Sequence to Sequence Learning for Optical Character Recognition	Nov 13, 2015	DecoderGeneral Classification	—Unverified
Sequence-to-Sequence Pre-training with Unified Modality Masking for Visual Document Understanding	May 16, 2023	Decoderdocument understanding	—Unverified
Shakti-VLMs: Scalable Vision-Language Models for Enterprise AI	Feb 24, 2025	document understandingMultimodal Reasoning	—Unverified
Similar Document Template Matching Algorithm	Nov 21, 2023	Fraud DetectionOptical Character Recognition (OCR)	—Unverified
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps	Dec 9, 2020	DecoderImage Captioning	—Unverified
Simple Transparent Adversarial Examples	May 20, 2021	Image Generationobject-detection	—Unverified
Simulation d’erreurs d’OCR dans les systèmes de TAL pour le traitement de données anachroniques (Simulation of OCR errors in NLP systems for processing anachronistic data)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
Sinica-IASL Chinese spelling check system at Sighan-7	Oct 1, 2013	Optical Character Recognition (OCR)	—Unverified
SIS@IIITH at SemEval-2020 Task 8: An Overview of Simple Text Classification Methods for Meme Analysis	Dec 1, 2020	ClassificationOptical Character Recognition (OCR)	—Unverified
Slide2Text: Leveraging LLMs for Personalized Textbook Generation from PowerPoint Presentations	Mar 22, 2025	Optical Character Recognition (OCR)	—Unverified
Solution for SMART-101 Challenge of ICCV Multi-modal Algorithmic Reasoning Task 2023	Oct 10, 2023	Decoderobject-detection	—Unverified
Solving Substitution Ciphers with Combined Language Models	Aug 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Southern Newswire Corpus: A Large-Scale Dataset of Mid-Century Wire Articles Beyond the Front Page	Feb 17, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
SPARLING: Learning Latent Representations with Extremely Sparse Activations	Feb 3, 2023	Optical Character Recognition (OCR)	—Unverified
Sparse Concept Coded Tetrolet Transform for Unconstrained Odia Character Recognition	Apr 3, 2020	Optical Character Recognition (OCR)	—Unverified
SpellBERT: A Lightweight Pretrained Model for Chinese Spelling Check	Nov 1, 2021	Graph Neural NetworkLanguage Modeling	—Unverified
Squibs: Spelling Error Patterns in Brazilian Portuguese	Mar 1, 2015	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Star-net: A spatial attention residue network for scene text recognition.	Sep 20, 2016	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Statistical Learning for OCR Text Correction	Nov 21, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Machine Learning Construction: implications to cybersecurity	Jun 24, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Statistical Machine Translation Improvement based on Phrase Selection	Sep 1, 2015	Language ModellingMachine Translation	—Unverified
Still not there? Comparing Traditional Sequence-to-Sequence Models to Encoder-Decoder Neural Networks on Monotone String Translation Tasks	Oct 25, 2016	DecoderGrapheme-to-Phoneme Conversion	—Unverified
STRIDE : Scene Text Recognition In-Device	May 17, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Structured Analysis and Comparison of Alphabets in Historical Handwritten Ciphers	Oct 29, 2024	CryptanalysisOptical Character Recognition (OCR)	—Unverified
Sum-Product Networks for Sequence Labeling	Jul 6, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SuperOCR: A Conversion from Optical Character Recognition to Image Captioning	Nov 21, 2020	Image CaptioningLicense Plate Recognition	—Unverified
SuperOCR for ALTA 2017 Shared Task	Dec 1, 2017	Language ModelingLanguage Modelling	—Unverified
Survey of Computational Approaches to Lexical Semantic Change	Nov 15, 2018	Change DetectionInformation Retrieval	—Unverified
SVDocNet: Spatially Variant U-Net for Blind Document Deblurring	Sep 14, 2019	DeblurringOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 13 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified