Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1209 papers

Title	Date	Tasks	Status
Semi-Structured Query Grounding for Document-Oriented Databases with Deep Retrieval and Its Application to Receipt and POI Matching	Feb 23, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Sequence-to-Label Script Identification for Multilingual OCR	Aug 15, 2017	Optical Character Recognition (OCR)	—Unverified
Sequence to Sequence Learning for Optical Character Recognition	Nov 13, 2015	DecoderGeneral Classification	—Unverified
Sequence-to-Sequence Pre-training with Unified Modality Masking for Visual Document Understanding	May 16, 2023	Decoderdocument understanding	—Unverified
Shakti-VLMs: Scalable Vision-Language Models for Enterprise AI	Feb 24, 2025	document understandingMultimodal Reasoning	—Unverified
Similar Document Template Matching Algorithm	Nov 21, 2023	Fraud DetectionOptical Character Recognition (OCR)	—Unverified
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps	Dec 9, 2020	DecoderImage Captioning	—Unverified
Simple Transparent Adversarial Examples	May 20, 2021	Image Generationobject-detection	—Unverified
Simulation d’erreurs d’OCR dans les systèmes de TAL pour le traitement de données anachroniques (Simulation of OCR errors in NLP systems for processing anachronistic data)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
Sinica-IASL Chinese spelling check system at Sighan-7	Oct 1, 2013	Optical Character Recognition (OCR)	—Unverified
SIS@IIITH at SemEval-2020 Task 8: An Overview of Simple Text Classification Methods for Meme Analysis	Dec 1, 2020	ClassificationOptical Character Recognition (OCR)	—Unverified
Slide2Text: Leveraging LLMs for Personalized Textbook Generation from PowerPoint Presentations	Mar 22, 2025	Optical Character Recognition (OCR)	—Unverified
Solution for SMART-101 Challenge of ICCV Multi-modal Algorithmic Reasoning Task 2023	Oct 10, 2023	Decoderobject-detection	—Unverified
Solving Substitution Ciphers with Combined Language Models	Aug 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Southern Newswire Corpus: A Large-Scale Dataset of Mid-Century Wire Articles Beyond the Front Page	Feb 17, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
SPARLING: Learning Latent Representations with Extremely Sparse Activations	Feb 3, 2023	Optical Character Recognition (OCR)	—Unverified
Sparse Concept Coded Tetrolet Transform for Unconstrained Odia Character Recognition	Apr 3, 2020	Optical Character Recognition (OCR)	—Unverified
SpellBERT: A Lightweight Pretrained Model for Chinese Spelling Check	Nov 1, 2021	Graph Neural NetworkLanguage Modeling	—Unverified
Squibs: Spelling Error Patterns in Brazilian Portuguese	Mar 1, 2015	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Star-net: A spatial attention residue network for scene text recognition.	Sep 20, 2016	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Statistical Learning for OCR Text Correction	Nov 21, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Machine Learning Construction: implications to cybersecurity	Jun 24, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Statistical Machine Translation Improvement based on Phrase Selection	Sep 1, 2015	Language ModellingMachine Translation	—Unverified
Still not there? Comparing Traditional Sequence-to-Sequence Models to Encoder-Decoder Neural Networks on Monotone String Translation Tasks	Oct 25, 2016	DecoderGrapheme-to-Phoneme Conversion	—Unverified
STRIDE : Scene Text Recognition In-Device	May 17, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Structured Analysis and Comparison of Alphabets in Historical Handwritten Ciphers	Oct 29, 2024	CryptanalysisOptical Character Recognition (OCR)	—Unverified
Sum-Product Networks for Sequence Labeling	Jul 6, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SuperOCR: A Conversion from Optical Character Recognition to Image Captioning	Nov 21, 2020	Image CaptioningLicense Plate Recognition	—Unverified
SuperOCR for ALTA 2017 Shared Task	Dec 1, 2017	Language ModelingLanguage Modelling	—Unverified
Survey of Computational Approaches to Lexical Semantic Change	Nov 15, 2018	Change DetectionInformation Retrieval	—Unverified
SVDocNet: Spatially Variant U-Net for Blind Document Deblurring	Sep 14, 2019	DeblurringOptical Character Recognition	—Unverified
SVTRv2: CTC Beats Encoder-Decoder Models in Scene Text Recognition	Nov 24, 2024	DecoderOptical Character Recognition (OCR)	—Unverified
SymbioticRAG: Enhancing Document Intelligence Through Human-LLM Symbiotic Collaboration	May 5, 2025	Optical Character Recognition (OCR)RAG	—Unverified
Synergy of Nederlab and	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Synthesizing Annotated Image and Video Data Using a Rendering-Based Pipeline for Improved License Plate Recognition	Sep 28, 2022	Data AugmentationLicense Plate Recognition	—Unverified
Table Structure Extraction with Bi-directional Gated Recurrent Unit Networks	Jan 8, 2020	document understandingOptical Character Recognition	—Unverified
Tablext: A Combined Neural Network And Heuristic Based Table Extractor	Apr 22, 2021	object-detectionObject Detection	—Unverified
Tag, Copy or Predict: A Unified Weakly-Supervised Learning Framework for Visual Information Extraction using Sequences	Jun 20, 2021	DecoderOptical Character Recognition	—Unverified
Tagging Named Entities in 19th Century and Modern Finnish Newspaper Material with a Finnish Semantic Tagger	May 1, 2017	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified
Tamil Vowel Recognition With Augmented MNIST-like Data Set	Jun 9, 2020	ClassificationGeneral Classification	—Unverified
TAP-VL: Text Layout-Aware Pre-training for Enriched Vision-Language Models	Nov 7, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
TC-OCR: TableCraft OCR for Efficient Detection & Recognition of Table Structure & Content	Apr 16, 2024	Information RetrievalKnowledge Graphs	—Unverified
TDeLTA: A Light-weight and Robust Table Detection Method based on Learning Text Arrangement	Dec 18, 2023	Optical Character Recognition (OCR)Table Detection	—Unverified
TECHLIMED@QALB-Shared Task 2015: a hybrid Arabic Error Correction System	Jul 1, 2015	Information RetrievalMachine Translation	—Unverified
TECHLIMED system description for the Shared Task on Automatic Arabic Error Correction	Oct 1, 2014	Information RetrievalMachine Translation	—Unverified
TeLCoS: OnDevice Text Localization with Clustering of Script	Apr 16, 2021	ClusteringImage Categorization	—Unverified
Telugu OCR Framework using Deep Learning	Sep 20, 2015	Deep LearningGeneral Classification	—Unverified
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
TextBlockV2: Towards Precise-Detection-Free Scene Text Spotting with Pre-trained Language Model	Mar 15, 2024	Language ModelingLanguage Modelling	—Unverified
TextCaps: a Dataset for Image Captioning with Reading Comprehension	Mar 24, 2020	Image CaptioningOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 14 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified