Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1209 papers

Title	Date	Tasks	Status
Text Change Detection in Multilingual Documents Using Image Comparison	Dec 5, 2024	BinarizationChange Detection	—Unverified
Text Detection on Technical Drawings for the Digitization of Brown-field Processes	May 5, 2022	Data Augmentationobject-detection	—Unverified
TextDiffuser: Diffusion Models as Text Painters	May 18, 2023	Optical Character Recognition (OCR)	—Unverified
TextDiffuser-RL: Efficient and Robust Text Layout Optimization for High-Fidelity Text-to-Image Synthesis	May 25, 2025	CPUGPU	—Unverified
Text Extraction and Retrieval from Smartphone Screenshots: Building a Repository for Life in Media	Jan 4, 2018	Image RetrievalOptical Character Recognition	—Unverified
Text Extraction From Texture Images Using Masked Signal Decomposition	Jun 11, 2017	Autonomous DrivingOptical Character Recognition	—Unverified
TextFlux: An OCR-Free DiT Model for High-Fidelity Multilingual Scene Text Synthesis	May 23, 2025	Optical Character Recognition (OCR)Text Generation	—Unverified
TextMaster: Universal Controllable Text Edit	Oct 13, 2024	Optical Character Recognition (OCR)Style Transfer	—Unverified
TextNet: Irregular Text Reading from Images with an End-to-End Trainable Network	Dec 24, 2018	Optical Character Recognition (OCR)Text Detection	—Unverified
TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text	May 12, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
TextPixs: Glyph-Conditioned Diffusion with Character-Aware Attention and OCR-Guided Supervision	Jul 8, 2025	Image GenerationOptical Character Recognition (OCR)	—Unverified
Text Reading Order in Uncontrolled Conditions by Sparse Graph Segmentation	May 4, 2023	Optical Character Recognition (OCR)	—Unverified
Text Recognition in Scene Image and Video Frame using Color Channel Selection	Jul 21, 2017	Binarizationchannel selection	—Unverified
TextSR: Diffusion Super-Resolution with Multilingual OCR Guidance	May 29, 2025	Image Super-ResolutionOptical Character Recognition	—Unverified
TFIC: End-to-End Text-Focused Image Compression for Coding for Machines	Mar 25, 2025	Image CompressionOptical Character Recognition	—Unverified
The Corpora They Are a-Changing: a Case Study in Italian Newspapers	Aug 1, 2021	Optical Character Recognition (OCR)	—Unverified
The future of document indexing: GPT and Donut revolutionize table of content processing	Mar 12, 2024	Language ModelingLanguage Modelling	—Unverified
The goo300k corpus of historical Slovene	May 1, 2012	LEMMALemmatization	—Unverified
The Hidden Structure -- Improving Legal Document Understanding Through Explicit Text Formatting	May 19, 2025	document understandingOptical Character Recognition (OCR)	—Unverified
The Interplay Between Lexical and Syntactic Resources in Incremental Parsebanking	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
The Labeled Segmentation of Printed Books	Sep 1, 2017	Optical Character Recognition (OCR)Segmentation	—Unverified
The Making of the Royal Society Corpus	May 1, 2017	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
The mathematics of language learning	Aug 1, 2013	Natural Language InferenceOptical Character Recognition (OCR)	—Unverified
The Monge-Kantorovich Optimal Transport Distance for Image Comparison	Apr 8, 2018	BIG-bench Machine LearningOptical Character Recognition	—Unverified
The OCR Quest for Generalization: Learning to recognize low-resource alphabets with model editing	Jun 7, 2025	Meta-LearningModel Editing	—Unverified
The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge	Mar 26, 2024	Caption GenerationImage Captioning	—Unverified
The System Description of dun_oscar team for The ICPR MSR Challenge	Mar 13, 2023	Optical Character Recognition (OCR)	—Unverified
TICCLops: Text-Induced Corpus Clean-up as online processing system	Aug 1, 2014	Optical Character Recognition (OCR)Spelling Correction	—Unverified
Tiger200K: Manually Curated High Visual Quality Video Dataset from UGC Platform	Apr 21, 2025	Boundary DetectionOptical Character Recognition (OCR)	—Unverified
TokBench: Evaluating Your Visual Tokenizer before Visual Generation	May 23, 2025	Face RecognitionFace Reconstruction	—Unverified
Toolbox : une chaîne de traitement de corpus pour les humanités numériques (Toolbox : a corpus processing pipeline for digital humanities)	Jun 1, 2022	HTROptical Character Recognition (OCR)	—Unverified
Topic Stability over Noisy Sources	Aug 5, 2015	Model SelectionOptical Character Recognition (OCR)	—Unverified
To show or not to show: Redacting sensitive text from videos of electronic displays	Aug 19, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering	Sep 21, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Toward a Period-Specific Optimized Neural Network for OCR Error Correction of Historical Hebrew Texts	Jul 30, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Toward Creation of Ancash Lexical Resources from OCR	Jun 1, 2021	Optical Character Recognition (OCR)	—Unverified
Towards Accessible Learning: Deep Learning-Based Potential Dysgraphia Detection and OCR for Potentially Dysgraphic Handwriting	Nov 18, 2024	DiagnosticOptical Character Recognition	—Unverified
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks	Mar 27, 2020	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Towards an ACL Anthology Corpus with Logical Document Structure. An Overview of the ACL 2012 Contributed Task	Jul 1, 2012	Optical Character Recognition (OCR)	—Unverified
Towards an Automatic Classification of Illustrative Examples in a Large Japanese-French Dictionary Obtained by OCR	Aug 1, 2018	General ClassificationMachine Translation	—Unverified
Towards Calibration Enhanced Network by Inverse Adversarial Attack	Apr 8, 2025	Adversarial AttackOptical Character Recognition	—Unverified
Towards Escaping from Language Bias and OCR Error: Semantics-Centered Text Visual Question Answering	Mar 24, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Towards Image-based Automatic Meter Reading in Unconstrained Scenarios: A Robust and Efficient Approach	Sep 21, 2020	Image-based Automatic Meter ReadingMeter Reading	—Unverified
Towards Multimodal Vision-Language Models Generating Non-Generic Text	Jul 9, 2022	DescriptiveOptical Character Recognition	—Unverified
Towards Natural Language-Based Document Image Retrieval: New Dataset and Benchmark	Jan 1, 2025	document understandingImage Retrieval	—Unverified
Towards Optimizing OCR for Accessibility	Jun 21, 2022	Optical Character Recognition (OCR)text-to-speech	—Unverified
Towards Processing of the Oral History Interviews and Related Printed Documents	May 1, 2018	Automatic Speech Recognition (ASR)Optical Character Recognition (OCR)	—Unverified
Towards reducing hallucination in extracting information from financial reports using Large Language Models	Oct 16, 2023	HallucinationOptical Character Recognition	—Unverified
Towards Robust Handwritten Text Recognition with On-the-fly User Participation	Dec 17, 2022	Handwritten Text RecognitionOptical Character Recognition (OCR)	—Unverified
Towards Unconstrained End-to-End Text Spotting	Aug 24, 2019	Instance SegmentationOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 15 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified