Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 1209 papers

Title	Date	Tasks	Status
French Word Recognition through a Quick Survey on Recurrent Neural Networks Using Long-Short Term Memory RNN-LSTM	Apr 10, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CHISPA on the GO: A mobile Chinese-Spanish translation service for travellers in trouble	Apr 1, 2014	Image RetrievalInformation Retrieval	—Unverified
Chinese/English mixed Character Segmentation as Semantic Segmentation	Nov 7, 2016	DiversityOptical Character Recognition (OCR)	—Unverified
Font Identification in Historical Documents Using Active Learning	Jan 27, 2016	Active LearningDiversity	—Unverified
A random forest system combination approach for error detection in digital dictionaries	Oct 30, 2014	Language ModelingLanguage Modelling	—Unverified
A Linked Data Model for Multimodal Sentiment and Emotion Analysis	Jul 1, 2015	Emotion RecognitionOpinion Mining	—Unverified
ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints	May 8, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Chaurah: A Smart Raspberry Pi based Parking System	Dec 28, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Finite State Approach to the Kazakh Nominal Paradigm	Jul 1, 2013	Morphological AnalysisOptical Character Recognition (OCR)	—Unverified
Finding the Evidence: Localization-aware Answer Prediction for Text Visual Question Answering	Oct 6, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ChatSchema: A pipeline of extracting structured information with Large Multimodal Models based on schema	Jul 26, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Arabic Handwritten Document OCR Solution with Binarization and Adaptive Scale Fusion Detection	Dec 2, 2024	BinarizationOptical Character Recognition (OCR)	—Unverified
Align Me: A framework to generate Parallel Corpus Using OCRs and Bilingual Dictionaries	Dec 1, 2016	Active LearningInformation Retrieval	—Unverified
Finding Names in Trove: Named Entity Recognition for Australian Historical Newspapers	Dec 1, 2015	Clusteringnamed-entity-recognition	—Unverified
Financial Table Extraction in Image Documents	Mar 18, 2024	Image SegmentationOptical Character Recognition (OCR)	—Unverified
FLELex: a graded lexical resource for French foreign learners	May 1, 2014	Language AcquisitionOptical Character Recognition (OCR)	—Unverified
Fetch-A-Set: A Large-Scale OCR-Free Benchmark for Historical Document Retrieval	Jun 11, 2024	Image RetrievalImage to text	—Unverified
Chart-RCNN: Efficient Line Chart Data Extraction from Camera Images	Nov 25, 2022	object-detectionObject Detection	—Unverified
Arabic Character Segmentation Using Projection Based Approach with Profile's Amplitude Filter	Jul 4, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ChartParser: Automatic Chart Parsing for Print-Impaired	Nov 16, 2022	Optical Character Recognition (OCR)	—Unverified
Fast Search with Poor OCR	Sep 17, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Fooling OCR Systems with Adversarial Text Images	Feb 15, 2018	Adversarial TextOptical Character Recognition	—Unverified
FormGym: Doing Paperwork with Agents	Jun 17, 2025	FormInformation Retrieval	—Unverified
Fraunhofer SIT at CheckThat! 2023: Mixing Single-Modal Classifiers to Estimate the Check-Worthiness of Multi-Modal Tweets	Jul 2, 2023	Fact CheckingOptical Character Recognition (OCR)	—Unverified
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified
From Machine Learning to Machine Reasoning	Feb 9, 2011	BIG-bench Machine LearningLanguage Modeling	—Unverified
ChartMind: A Comprehensive Benchmark for Complex Real-world Multimodal Chart Question Answering	May 29, 2025	Chart Question AnsweringChart Understanding	—Unverified
A Proposal of Automatic Error Correction in Text	Sep 24, 2021	Information RetrievalLanguage Modelling	—Unverified
Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation	Mar 14, 2024	Image to textOptical Character Recognition (OCR)	—Unverified
ChartEye: A Deep Learning Framework for Chart Information Extraction	Aug 28, 2024	Chart UnderstandingClassification	—Unverified
ExTTNet: A Deep Learning Algorithm for Extracting Table Texts from Invoice Images	Feb 3, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Extraction of Line Word Character Segments Directly from Run Length Compressed Printed Text Documents	Mar 30, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs	Mar 19, 2024	Chart Question AnsweringOptical Character Recognition (OCR)	—Unverified
Extracting Weighted Language Lexicons from Wikipedia	May 1, 2016	ArticlesInformation Retrieval	—Unverified
Extracting structured data from invoices	Dec 1, 2018	BIG-bench Machine LearningOptical Character Recognition (OCR)	—Unverified
Chargrid-OCR: End-to-end trainable Optical Character Recognition through Semantic Segmentation and Object Detection	Sep 14, 2019	GPUobject-detection	—Unverified
EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQA	Aug 22, 2021	Open-Ended Question AnsweringOptical Character Recognition (OCR)	—Unverified
Extending TrOCR for Text Localization-Free OCR of Full-Page Scanned Receipt Images	Dec 11, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Chargrid-OCR: End-to-end Trainable Optical Character Recognition for Printed Documents using Instance Segmentation	Sep 10, 2019	GPUInstance Segmentation	—Unverified
A preliminary study on similarity-preserving digital book identifiers	Jul 1, 2015	Optical Character Recognition (OCR)	—Unverified
Applying BLAST to Text Reuse Detection in Finnish Newspapers and Journals, 1771-1910	May 1, 2017	Optical Character Recognition (OCR)	—Unverified
Generating Monolingual Dataset for Low Resource Language Bodo from old books using Google Keep	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail	Oct 26, 2022	CPUOptical Character Recognition	—Unverified
A Black-Box Attack on Optical Character Recognition Systems	Aug 30, 2022	Adversarial AttackBinarization	—Unverified
Extended Named Entities Annotation on OCRed Documents: From Corpus Constitution to Evaluation Campaign	May 1, 2012	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified
Exploring Sparse Spatial Relation in Graph Inference for Text-Based VQA	Oct 13, 2023	Graph LearningObject	—Unverified
Geometric Rectification of Creased Document Images based on Isometric Mapping	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Character Keypoint-based Homography Estimation in Scanned Documents for Efficient Information Extraction	Nov 14, 2019	Homography EstimationOptical Character Recognition	—Unverified
A Possibilistic Approach for Automatic Word Sense Disambiguation	Sep 1, 2012	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images	Jan 16, 2025	De-identificationOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 10 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified