Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 1209 papers

Title	Date	Tasks	Status
Indigenous language technologies in Canada: Assessment, challenges, and successes	Aug 1, 2018	Machine TranslationOptical Character Recognition	—Unverified
Indonesian ID Card Extractor Using Optical Character Recognition and Natural Language Post-Processing	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Information Extraction from Scanned Invoice Images using Text Analysis and Layout Features	Aug 8, 2022	Optical Character Recognition (OCR)	—Unverified
Information Extraction from Unstructured data using Augmented-AI and Computer Vision	Dec 15, 2023	Optical Character Recognition (OCR)	—Unverified
Information Retrieval from the Digitized Books	Dec 2, 2022	Image RetrievalInformation Retrieval	—Unverified
Integrating Optical Character Recognition and Machine Translation of Historical Documents	Dec 1, 2016	Language ModelingLanguage Modelling	—Unverified
Integration of Text-maps in Convolutional Neural Networks for Region Detection among Different Textual Categories	May 26, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Intelligent Automation for FDI Facilitation: Optimizing Tariff Exemption Processes with OCR And Large Language Models	Jun 12, 2025	Large Language ModelOptical Character Recognition	—Unverified
Intelligent Document Processing -- Methods and Tools in the real world	Dec 28, 2021	Document ClassificationOptical Character Recognition (OCR)	—Unverified
Interpretable Distance Metric Learning for Handwritten Chinese Character Recognition	Mar 17, 2021	DiversityHandwriting Recognition	—Unverified
Introducing One Sided Margin Loss for Solving Classification Problems in Deep Networks	Jun 2, 2022	ClassificationOptical Character Recognition	—Unverified
Introducing the Reference Corpus of Contemporary Portuguese Online	May 1, 2012	Optical Character Recognition (OCR)	—Unverified
Investigating the Decoders of Maximum Likelihood Sequence Models: A Look-ahead Approach	Mar 8, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
Invisible Threats: Backdoor Attack in OCR Systems	Oct 12, 2023	Backdoor AttackOptical Character Recognition	—Unverified
Is Cognition consistent with Perception? Assessing and Mitigating Multimodal Knowledge Conflicts in Document Understanding	Nov 12, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Is it possible to recover personal health information from an automatically de-identified corpus of French EHRs?	Sep 1, 2015	Optical Character Recognition (OCR)	—Unverified
Iterative Learning for Reliable Crowdsourcing Systems	Dec 1, 2011	image-classificationImage Classification	—Unverified
JaPOC: Japanese Post-OCR Correction Benchmark using Vouchers	Sep 30, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
JoyType: A Robust Design for Multilingual Visual Text Creation	Sep 26, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
K-Algorithm A Modified Technique for Noise Removal in Handwritten Documents	Jun 6, 2013	BinarizationOptical Character Recognition (OCR)	—Unverified
Key Information Extraction in Purchase Documents using Deep Learning and Rule-based Corrections	Oct 7, 2022	Key Information ExtractionLine Detection	—Unverified
Khattat: Enhancing Readability and Concept Representation of Semantic Typography	Oct 1, 2024	Language ModelingLanguage Modelling	—Unverified
KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding	Feb 20, 2025	document understandingOptical Character Recognition	—Unverified
Knowledge Discovery in Optical Music Recognition: Enhancing Information Retrieval with Instance Segmentation	Aug 27, 2024	Information RetrievalInstance Segmentation	—Unverified
Language Classification and Segmentation of Noisy Documents in Hebrew Scripts	Apr 1, 2012	ClassificationGeneral Classification	—Unverified
Language Independent Single Document Image Super-Resolution using CNN for improved recognition	Jan 30, 2017	Image EnhancementImage Super-Resolution	—Unverified
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
Language Matters: A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting	Mar 8, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Large Language Models for Page Stream Segmentation	Aug 21, 2024	DecoderOptical Character Recognition	—Unverified
Large Language Models for Simultaneous Named Entity Extraction and Spelling Correction	Mar 1, 2024	DecoderOptical Character Recognition	—Unverified
LayoutReader: Pre-training of Text and Layout for Reading Order Detection	Aug 26, 2021	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified
Learning Adaptive Value of Information for Structured Prediction	Dec 1, 2013	feature selectionModel Selection	—Unverified
Learning Ensembles of Structured Prediction Rules	Jun 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Learning Multiple Tasks in Parallel with a Shared Annotator	Dec 1, 2014	Binary ClassificationDocument Classification	—Unverified
Learning UI Navigation through Demonstrations composed of Macro Actions	Oct 16, 2021	Optical Character Recognition (OCR)	—Unverified
Legal Entity Extraction using a Pointer Generator Network	Jan 20, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Lesan -- Machine Translation for Low Resource Languages	Dec 15, 2021	ArticlesMachine Translation	—Unverified
Leveraging Statistical Transliteration for Dictionary-Based English-Bengali CLIR of OCR`d Text	Dec 1, 2012	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Leveraging Text Repetitions and Denoising Autoencoders in OCR Post-correction	Jun 26, 2019	DenoisingOptical Character Recognition (OCR)	—Unverified
License Plate Recognition System Based on Color Coding Of License Plates	Jun 8, 2015	License Plate RecognitionOptical Character Recognition	—Unverified
Linear-Time Sequence Classification using Restricted Boltzmann Machines	Oct 6, 2017	ChunkingClassification	—Unverified
Linguistic Resources for Handwriting Recognition and Translation Evaluation	May 1, 2012	Document ClassificationHandwriting Recognition	—Unverified
Linking Representations with Multimodal Contrastive Learning	Apr 7, 2023	Contrastive LearningOptical Character Recognition	—Unverified
Lipi Gnani - A Versatile OCR for Documents in any Language Printed in Kannada Script	Jan 2, 2019	BinarizationOptical Character Recognition (OCR)	—Unverified
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified
Local String Transduction as Sequence Labeling	Aug 1, 2018	LemmatizationMachine Translation	—Unverified
LOCR: Location-Guided Transformer for Optical Character Recognition	Mar 4, 2024	MarketingOptical Character Recognition	—Unverified
Logios : An open source Greek Polytonic Optical Character Recognition system	Jun 26, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified
Lost in OCR Translation? Vision-Based Approaches to Robust Document Retrieval	May 8, 2025	Computational EfficiencyOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 24 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified