Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1209 papers

Title	Date	Tasks	Status
Topic Stability over Noisy Sources	Aug 5, 2015	Model SelectionOptical Character Recognition (OCR)	—Unverified
To show or not to show: Redacting sensitive text from videos of electronic displays	Aug 19, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering	Sep 21, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Toward a Period-Specific Optimized Neural Network for OCR Error Correction of Historical Hebrew Texts	Jul 30, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Toward Creation of Ancash Lexical Resources from OCR	Jun 1, 2021	Optical Character Recognition (OCR)	—Unverified
Towards Accessible Learning: Deep Learning-Based Potential Dysgraphia Detection and OCR for Potentially Dysgraphic Handwriting	Nov 18, 2024	DiagnosticOptical Character Recognition	—Unverified
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks	Mar 27, 2020	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Towards an ACL Anthology Corpus with Logical Document Structure. An Overview of the ACL 2012 Contributed Task	Jul 1, 2012	Optical Character Recognition (OCR)	—Unverified
Towards an Automatic Classification of Illustrative Examples in a Large Japanese-French Dictionary Obtained by OCR	Aug 1, 2018	General ClassificationMachine Translation	—Unverified
Towards Calibration Enhanced Network by Inverse Adversarial Attack	Apr 8, 2025	Adversarial AttackOptical Character Recognition	—Unverified
Towards Escaping from Language Bias and OCR Error: Semantics-Centered Text Visual Question Answering	Mar 24, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Towards Image-based Automatic Meter Reading in Unconstrained Scenarios: A Robust and Efficient Approach	Sep 21, 2020	Image-based Automatic Meter ReadingMeter Reading	—Unverified
Towards Multimodal Vision-Language Models Generating Non-Generic Text	Jul 9, 2022	DescriptiveOptical Character Recognition	—Unverified
Towards Natural Language-Based Document Image Retrieval: New Dataset and Benchmark	Jan 1, 2025	document understandingImage Retrieval	—Unverified
Towards Optimizing OCR for Accessibility	Jun 21, 2022	Optical Character Recognition (OCR)text-to-speech	—Unverified
Towards Processing of the Oral History Interviews and Related Printed Documents	May 1, 2018	Automatic Speech Recognition (ASR)Optical Character Recognition (OCR)	—Unverified
Towards reducing hallucination in extracting information from financial reports using Large Language Models	Oct 16, 2023	HallucinationOptical Character Recognition	—Unverified
Towards Robust Handwritten Text Recognition with On-the-fly User Participation	Dec 17, 2022	Handwritten Text RecognitionOptical Character Recognition (OCR)	—Unverified
Towards Unconstrained End-to-End Text Spotting	Aug 24, 2019	Instance SegmentationOptical Character Recognition (OCR)	—Unverified
Towards Unified Multi-granularity Text Detection with Interactive Attention	May 30, 2024	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified
Towards Visual Text Design Transfer Across Languages	Oct 24, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
Towards Visual Text Grounding of Multimodal Large Language Model	Apr 7, 2025	BenchmarkingLanguage Modeling	—Unverified
Toward Zero-shot Character Recognition: A Gold Standard Dataset with Radical-level Annotations	Aug 1, 2023	DenoisingImage Denoising	—Unverified
Tracing Text Provenance via Context-Aware Lexical Substitution	Dec 15, 2021	Optical Character Recognition (OCR)Sentence	—Unverified
Training \& Quality Assessment of an Optical Character Recognition Model for Northern Haida	May 1, 2016	Image GenerationOptical Character Recognition	—Unverified
Traitement des Mots Hors Vocabulaire pour la Traduction Automatique de Document OCRis\'es en Arabe (This article presents a new system that automatically translates images of arabic documents)	Jun 1, 2017	es-enOptical Character Recognition (OCR)	—Unverified
Transfer Learning Approach for Railway Technical Map (RTM) Component Identification	May 21, 2024	Managementobject-detection	—Unverified
Transferring General Multimodal Pretrained Models to Text Recognition	Dec 19, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Transferring Modern Named Entity Recognition to the Historical Domain: How to Take the Step?	Dec 1, 2021	named-entity-recognitionNamed Entity Recognition	—Unverified
Transformer-Based UNet with Multi-Headed Cross-Attention Skip Connections to Eliminate Artifacts in Scanned Documents	Jun 5, 2023	DenoisingDocument Classification	—Unverified
Transformer based Urdu Handwritten Text Optical Character Reader	Jun 9, 2022	Natural Language UnderstandingOptical Character Recognition (OCR)	—Unverified
Transformers Utilization in Chart Understanding: A Review of Recent Advances & Future Trends	Oct 5, 2024	BenchmarkingChart Understanding	—Unverified
Transliterated Mobile Keyboard Input via Weighted Finite-State Transducers	Sep 1, 2017	Language ModelingLanguage Modelling	—Unverified
Tree-Structured Named Entity Recognition on OCR Data: Analysis, Processing and Results	May 1, 2012	Language ModelingLanguage Modelling	—Unverified
TS-Net: OCR Trained to Switch Between Text Transcription Styles	Mar 9, 2021	Optical Character Recognition (OCR)	—Unverified
Twitter100k: A Real-world Dataset for Weakly Supervised Cross-Media Retrieval	Mar 20, 2017	Optical Character Recognition (OCR)Retrieval	—Unverified
Two Decades of Bengali Handwritten Digit Recognition: A Survey	Jun 5, 2022	Handwritten Digit RecognitionOptical Character Recognition	—Unverified
Ultra Light OCR Competition Technical Report	Oct 25, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Unfolding the Past: A Comprehensive Deep Learning Approach to Analyzing Incunabula Pages	Jun 22, 2025	image-classificationImage Classification	—Unverified
Unifying Multimodal Retrieval via Document Screenshot Embedding	Jun 17, 2024	Language ModellingNatural Questions	—Unverified
Unitail: Detecting, Reading, and Matching in Retail Scene	Apr 1, 2022	BenchmarkingDense Object Detection	—Unverified
UNIT: Unifying Image and Text Recognition in One Vision Encoder	Sep 6, 2024	DecoderOptical Character Recognition (OCR)	—Unverified
Unraveling Movie Genres through Cross-Attention Fusion of Bi-Modal Synergy of Poster	Oct 12, 2024	Genre classificationMarketing	—Unverified
Unsupervised Code-Switching for Multilingual Historical Document Transcription	May 1, 2015	Language IdentificationLanguage Modeling	—Unverified
Unsupervised Morphology-Based Vocabulary Expansion	Jun 1, 2014	Language ModellingMachine Translation	—Unverified
Unsupervised morph segmentation and statistical language models for vocabulary expansion	Aug 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Unsupervised Multi-View Post-OCR Error Correction With Language Models	Nov 1, 2021	Domain AdaptationLanguage Modeling	—Unverified
Unsupervised Transcription of Historical Documents	Aug 1, 2013	Optical Character Recognition (OCR)	—Unverified
UPOCR: Towards Unified Pixel-Level OCR Interface	Dec 5, 2023	DecoderOptical Character Recognition	—Unverified
A Permuted Autoregressive Approach to Word-Level Recognition for Urdu Digital Text	Aug 27, 2024	Data AugmentationOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 15 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified