Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1209 papers

Title	Date	Tasks	Status
Vulnerability Analysis of Transformer-based Optical Character Recognition to Adversarial Attacks	Nov 28, 2023	Adversarial AttackOptical Character Recognition	—Unverified
Weakly Supervised Construction of ASR Systems with Massive Video Data	Aug 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weakly supervised information extraction from inscrutable handwritten document images	Jun 12, 2023	Language ModelingLanguage Modelling	—Unverified
We Live in a Motorized Civilization: Robert Moses Replies to Robert Caro	Mar 26, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Training BERT Models to Carry Over a Coding System Developed on One Corpus to Another	Aug 7, 2023	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
What Large Language Models Bring to Text-rich VQA?	Nov 13, 2023	Image ComprehensionOptical Character Recognition (OCR)	—Unverified
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified
What Media Frames Reveal About Stance: A Dataset and Study about Memes in Climate Change Discourse	May 22, 2025	Optical Character Recognition (OCR)Stance Detection	—Unverified
Words as Geometric Features: Estimating Homography using Optical Character Recognition as Compressed Image Representation	May 25, 2025	Anomaly DetectionHomography Estimation	—Unverified
Word Searching in Scene Image and Video Frame in Multi-Script Scenario using Dynamic Shape Coding	Aug 18, 2017	Keyword SpottingOptical Character Recognition (OCR)	—Unverified
Word Segmentation from Unconstrained Handwritten Bangla Document Images using Distance Transform	Sep 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
You’ve translated it, now what?	Sep 1, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified
An Ensemble of Neural Networks for Non-Linear Segmentation of Overlapped Cursive Script	Apr 7, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
JoyType: A Robust Design for Multilingual Visual Text Creation	Sep 26, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
K-Algorithm A Modified Technique for Noise Removal in Handwritten Documents	Jun 6, 2013	BinarizationOptical Character Recognition (OCR)	—Unverified
Key Information Extraction in Purchase Documents using Deep Learning and Rule-based Corrections	Oct 7, 2022	Key Information ExtractionLine Detection	—Unverified
Khattat: Enhancing Readability and Concept Representation of Semantic Typography	Oct 1, 2024	Language ModelingLanguage Modelling	—Unverified
KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding	Feb 20, 2025	document understandingOptical Character Recognition	—Unverified
Knowledge Discovery in Optical Music Recognition: Enhancing Information Retrieval with Instance Segmentation	Aug 27, 2024	Information RetrievalInstance Segmentation	—Unverified
Language Classification and Segmentation of Noisy Documents in Hebrew Scripts	Apr 1, 2012	ClassificationGeneral Classification	—Unverified
Language Independent Single Document Image Super-Resolution using CNN for improved recognition	Jan 30, 2017	Image EnhancementImage Super-Resolution	—Unverified
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
Language Matters: A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting	Mar 8, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Large Language Models for Page Stream Segmentation	Aug 21, 2024	DecoderOptical Character Recognition	—Unverified
Large Language Models for Simultaneous Named Entity Extraction and Spelling Correction	Mar 1, 2024	DecoderOptical Character Recognition	—Unverified
LayoutReader: Pre-training of Text and Layout for Reading Order Detection	Aug 26, 2021	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified
Learning Adaptive Value of Information for Structured Prediction	Dec 1, 2013	feature selectionModel Selection	—Unverified
Learning Ensembles of Structured Prediction Rules	Jun 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Learning Multiple Tasks in Parallel with a Shared Annotator	Dec 1, 2014	Binary ClassificationDocument Classification	—Unverified
Learning UI Navigation through Demonstrations composed of Macro Actions	Oct 16, 2021	Optical Character Recognition (OCR)	—Unverified
Legal Entity Extraction using a Pointer Generator Network	Jan 20, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Lesan -- Machine Translation for Low Resource Languages	Dec 15, 2021	ArticlesMachine Translation	—Unverified
Leveraging Statistical Transliteration for Dictionary-Based English-Bengali CLIR of OCR`d Text	Dec 1, 2012	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Leveraging Text Repetitions and Denoising Autoencoders in OCR Post-correction	Jun 26, 2019	DenoisingOptical Character Recognition (OCR)	—Unverified
License Plate Recognition System Based on Color Coding Of License Plates	Jun 8, 2015	License Plate RecognitionOptical Character Recognition	—Unverified
Linear-Time Sequence Classification using Restricted Boltzmann Machines	Oct 6, 2017	ChunkingClassification	—Unverified
Linguistic Resources for Handwriting Recognition and Translation Evaluation	May 1, 2012	Document ClassificationHandwriting Recognition	—Unverified
Linking Representations with Multimodal Contrastive Learning	Apr 7, 2023	Contrastive LearningOptical Character Recognition	—Unverified
Lipi Gnani - A Versatile OCR for Documents in any Language Printed in Kannada Script	Jan 2, 2019	BinarizationOptical Character Recognition (OCR)	—Unverified
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified
Local String Transduction as Sequence Labeling	Aug 1, 2018	LemmatizationMachine Translation	—Unverified
LOCR: Location-Guided Transformer for Optical Character Recognition	Mar 4, 2024	MarketingOptical Character Recognition	—Unverified
Logios : An open source Greek Polytonic Optical Character Recognition system	Jun 26, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified
Lost in OCR Translation? Vision-Based Approaches to Robust Document Retrieval	May 8, 2025	Computational EfficiencyOptical Character Recognition	—Unverified
Low-resource OCR error detection and correction in French Clinical Texts	Nov 1, 2016	Language ModelingLanguage Modelling	—Unverified
Low-resource Post Processing of Noisy OCR Output for Historical Corpus Digitisation	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
LVAgent: Long Video Understanding by Multi-Round Dynamical Collaboration of MLLM Agents	Mar 13, 2025	Computational EfficiencyOptical Character Recognition (OCR)	—Unverified
M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding	Nov 7, 2024	document understandingOptical Character Recognition	—Unverified
Making Old Kurdish Publications Processable by Augmenting Available Optical Character Recognition Engines	Apr 9, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 17 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified