Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1209 papers

Title	Date	Tasks	Status
Derivate-based Component-Trees for Multi-Channel Image Segmentation	May 4, 2017	Image SegmentationOptical Character Recognition (OCR)	—Unverified
Design and Development of a Framework For Stroke-Based Handwritten Gujarati Font Generation	Apr 4, 2024	Font GenerationOptical Character Recognition (OCR)	—Unverified
Design and Implementation of an OCR-Powered Pipeline for Table Extraction from Invoices	Jul 9, 2025	Boundary DetectionOptical Character Recognition (OCR)	—Unverified
Detecting de minimis Code-Switching in Historical German Books	Dec 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
D\'etection d'erreurs dans des transcriptions OCR de documents historiques par r\'eseaux de neurones r\'ecurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
Detection Masking for Improved OCR on Noisy Documents	May 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Reciprocal Feature Learning via Explicit and Implicit Tasks in Scene Text Recognition	May 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Recognition of Images of Korean Characters Using Embedded Networks	Nov 11, 2019	Optical Character Recognition (OCR)	—Unverified
Recognition of Text Image Using Multilayer Perceptron	Dec 2, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Recommending Scientific Videos based on Metadata Enrichment using Linked Open Data	Jun 19, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Reconnaissance d’entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique (Resolution of entity linking issues on noisy OCR output : automatic disambiguation tracks)	Jun 1, 2022	Entity LinkingOptical Character Recognition (OCR)	—Unverified
Recursive Recurrent Nets with Attention Modeling for OCR in the Wild	Mar 9, 2016	Language ModelingLanguage Modelling	—Unverified
Reference-Based Post-OCR Processing with LLM for Diacritic Languages	Oct 17, 2024	Optical Character Recognition (OCR)	—Unverified
Refining Corpora from a Model Calibration Perspective for Chinese Spelling Correction	Jul 22, 2024	Data AugmentationOptical Character Recognition (OCR)	—Unverified
Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation	Mar 25, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
Regularization and Kernelization of the Maximin Correlation Approach	Feb 21, 2015	ClassificationGeneral Classification	—Unverified
ReLayout: Towards Real-World Document Understanding via Layout-enhanced Pre-training	Oct 14, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Representing Online Handwriting for Recognition in Large Vision-Language Models	Feb 23, 2024	Handwriting RecognitionOptical Character Recognition	—Unverified
Reranking with Linguistic and Semantic Features for Arabic Optical Character Recognition	Aug 1, 2013	Language ModellingLearning-To-Rank	—Unverified
Resilience of Large Language Models for Noisy Instructions	Apr 15, 2024	Automatic Speech RecognitionOptical Character Recognition	—Unverified
Resolving Referring Expressions in Images With Labeled Elements	Oct 24, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Resolving Sentiment Discrepancy for Multimodal Sentiment Detection via Semantics Completion and Decomposition	Jul 9, 2024	Contrastive LearningOptical Character Recognition (OCR)	—Unverified
Resource Constrained Structured Prediction	Feb 28, 2016	Dependency ParsingOptical Character Recognition	—Unverified
Resume Information Extraction via Post-OCR Text Processing	Jun 23, 2023	Object RecognitionOptical Character Recognition	—Unverified
Rethinking Visual Prompting for Multimodal Large Language Models with External Knowledge	Jul 5, 2024	Instance SegmentationOptical Character Recognition (OCR)	—Unverified
Revisiting Noise in Natural Language Processing for Computational Social Science	Mar 10, 2025	Optical Character Recognition (OCR)	—Unverified
Rich Semantic Knowledge Enhanced Large Language Models for Few-shot Chinese Spell Checking	Mar 13, 2024	Chinese Spell CheckingIn-Context Learning	—Unverified
Robustness Evaluation of Transformer-based Form Field Extractors via Form Attacks	Oct 8, 2021	FormOptical Character Recognition (OCR)	—Unverified
Robust Text CAPTCHAs Using Adversarial Examples	Jan 7, 2021	Adversarial AttackOptical Character Recognition (OCR)	—Unverified
Rosetta: Large scale system for text detection and recognition in images	Oct 11, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SAHSOH@QALB-2015 Shared Task: A Rule-Based Correction Method of Common Arabic Native and Non-Native Speakers' Errors	Jul 1, 2015	Machine TranslationMorphological Analysis	—Unverified
SAML-QC: a Stochastic Assessment and Machine Learning based QC technique for Industrial Printing	Jan 18, 2019	BIG-bench Machine LearningOptical Character Recognition	—Unverified
SARD: A Large-Scale Synthetic Arabic OCR Dataset for Book-Style Text Recognition	May 30, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents	May 19, 2025	Dataset GenerationOptical Character Recognition (OCR)	—Unverified
Scaling Automatic Extraction of Pseudocode	Jun 7, 2024	Code GenerationOptical Character Recognition	—Unverified
Scatteract: Automated extraction of data from scatter plots	Apr 21, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
SceneGATE: Scene-Graph based co-Attention networks for TExt visual question answering	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Scene Text recognition with Full Normalization	Jul 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild	Jan 6, 2025	AttributeOptical Character Recognition	—Unverified
SciCapenter: Supporting Caption Composition for Scientific Figures with Machine-Generated Captions and Ratings	Mar 26, 2024	Optical Character Recognition (OCR)	—Unverified
Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models	Jun 25, 2025	document understandingHallucination	—Unverified
Seeing the Signs: A Survey of Edge-Deployable OCR Models for Billboard Visibility Analysis	Jul 15, 2025	MarketingOptical Character Recognition	—Unverified
See then Tell: Enhancing Key Information Extraction with Vision Grounding	Sep 29, 2024	Image to textKey Information Extraction	—Unverified
SEE: Towards Semi-SupervisedEnd-to-End Scene Text Recognition	Dec 14, 2017	Optical Character Recognition (OCR)Scene Text Detection	—Unverified
Segmentation-free Connectionist Temporal Classification loss based OCR Model for Text Captcha Classification	Feb 8, 2024	CAPTCHA DetectionClassification	—Unverified
Self-paced learning to improve text row detection in historical documents with missing labels	Jan 28, 2022	Missing LabelsOptical Character Recognition	—Unverified
Self-supervised Data Bootstrapping for Deep Optical Character Recognition of Identity Documents	Aug 12, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Semantic rule Web-based Diagnosis and Treatment of Vector-Borne Diseases using SWRL rules	Jan 8, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Semantic Segmentation for Real-World and Synthetic Vehicle's Forward-Facing Camera Images	Jul 7, 2024	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
Semi-automated annotation of page-based documents within the Genre and Multimodality framework	Aug 1, 2016	Optical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 13 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified