Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1209 papers

Title	Date	Tasks	Status
LMV-RPA: Large Model Voting-based Robotic Process Automation	Dec 23, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Automatic Metadata Extraction Incorporating Visual Features from Scanned Electronic Theses and Dissertations	Jul 1, 2021	Key Information ExtractionOptical Character Recognition (OCR)	CodeCode Available
An Open Source Contractual Language Understanding Application Using Machine Learning	Jun 1, 2022	Document Text ClassificationInformation Retrieval	CodeCode Available
Document Image Cleaning using Budget-Aware Black-Box Approximation	Jun 22, 2023	Optical Character Recognition (OCR)	CodeCode Available
iExam: A Novel Online Exam Monitoring and Analysis System Based on Face Detection and Recognition	Jun 27, 2022	Face DetectionFace Recognition	CodeCode Available
Alleviating Digitization Errors in Named Entity Recognition for Historical Documents	Nov 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available
An OCR system for the Unified Northern Alphabet	Jan 1, 2019	Optical Character Recognition (OCR)	CodeCode Available
Parallel Iterative Edit Models for Local Sequence Transduction	Oct 7, 2019	DecoderGrammatical Error Correction	CodeCode Available
CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models	Aug 30, 2024	Articlesnamed-entity-recognition	CodeCode Available
PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents	May 1, 2018	Coreference ResolutionOptical Character Recognition (OCR)	CodeCode Available
Cleaning Dirty Books: Post-OCR Processing for Previously Scanned Texts	Oct 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Arrow-Guided VLM: Enhancing Flowchart Understanding via Arrow Direction Encoding	May 9, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation	Jun 12, 2024	Document Level Machine TranslationDocument Translation	CodeCode Available
A Data-driven Investigation of Euphemistic Language: Comparing the usage of "slave" and "servant" in 19th century US newspapers	Mar 19, 2025	Optical Character Recognition (OCR)	CodeCode Available
DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation	Jun 25, 2024	Computational EfficiencyOptical Character Recognition (OCR)	CodeCode Available
Historical Ink: 19th Century Latin American Spanish Newspaper Corpus with LLM OCR Correction	Jul 4, 2024	Language ModelingLanguage Modelling	CodeCode Available
Adapting the Tesseract Open Source OCR Engine for Multilingual OCR	Jul 25, 2009	Optical Character Recognition (OCR)	CodeCode Available
Augmented Math: Authoring AR-Based Explorable Explanations by Augmenting Static Math Textbooks	Jul 30, 2023	MathOptical Character Recognition	CodeCode Available
High-Throughput Phenotyping using Computer Vision and Machine Learning	Jul 8, 2024	Image SegmentationOptical Character Recognition	CodeCode Available
HENet: Forcing a Network to Think More for Font Recognition	Oct 21, 2021	Font RecognitionOptical Character Recognition (OCR)	CodeCode Available
DLaVA: Document Language and Vision Assistant for Answer Localization with Enhanced Interpretability and Trustworthiness	Nov 29, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network	Apr 12, 2021	DecoderOptical Character Recognition (OCR)	CodeCode Available
PHD: Pixel-Based Language Modeling of Historical Documents	Oct 22, 2023	Language ModelingLanguage Modelling	CodeCode Available
MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features	Sep 25, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Handwritten Text Segmentation via End-to-End Learning of Convolutional Neural Network	Jun 12, 2019	Optical Character Recognition (OCR)Text Segmentation	CodeCode Available
DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regression Networks	Oct 1, 2019	3D geometryLocal Distortion	CodeCode Available
Single Classifier-based Passive System for Source Printer Classification using Local Texture Features	Jun 22, 2017	General ClassificationOptical Character Recognition (OCR)	CodeCode Available
Measuring Intersectional Biases in Historical Documents	May 21, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Detecting Offensive Memes with Social Biases in Singapore Context Using Multimodal Large Language Models	Feb 25, 2025	Optical Character Recognition (OCR)	CodeCode Available
Handwritten Code Recognition for Pen-and-Paper CS Education	Aug 7, 2024	HallucinationLanguage Modeling	CodeCode Available
PIXELMOD: Improving Soft Moderation of Visual Misleading Information on Twitter	Jul 30, 2024	MisinformationOptical Character Recognition	CodeCode Available
An Evaluation of OCR on Egocentric Data	Jun 11, 2022	Optical Character Recognition (OCR)	CodeCode Available
Attention-based Extraction of Structured Information from Street View Imagery	Apr 11, 2017	Optical Character Recognition (OCR)	CodeCode Available
An Evaluation of DNN Architectures for Page Segmentation of Historical Newspapers	Apr 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Chinese Text in the Wild	Feb 28, 2018	Optical Character Recognition (OCR)	CodeCode Available
Handwriting Classification for the Analysis of Art-Historical Documents	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available
MIDV-2019: Challenges of the modern mobile-based document OCR	Oct 9, 2019	Face DetectionOptical Character Recognition (OCR)	CodeCode Available
DeQA-Doc: Adapting DeQA-Score to Document Image Quality Assessment	Jul 17, 2025	Document Image Quality AssessmentImage Quality Assessment	CodeCode Available
Aligned Music Notation and Lyrics Transcription	Dec 5, 2024	Language ModelingLanguage Modelling	CodeCode Available
Analyzing Green View Index and Green View Index best path using Google Street View and deep learning	Apr 26, 2021	Optical Character Recognition (OCR)Semantic Segmentation	CodeCode Available
PopEval: A Character-Level Approach to End-To-End Evaluation Compatible with Word-Level Benchmark Dataset	Aug 29, 2019	Optical Character Recognition (OCR)	CodeCode Available
Mining Spatio-temporal Data on Industrialization from Historical Registries	Dec 3, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
DELINE8K: A Synthetic Data Pipeline for the Semantic Segmentation of Historical Documents	Apr 30, 2024	8kDiversity	CodeCode Available
Post-OCR parsing: building simple and robust parser via BIO tagging	Sep 14, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Post-OCR Text Correction for Bulgarian Historical Documents	Aug 31, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
An efficient way for segmentation of Bangla characters in printed document using curved scanning	May 13, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
DeepErase: Weakly Supervised Ink Artifact Removal in Document Text Images	Oct 15, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts	Dec 20, 2024	BenchmarkingOptical Character Recognition	CodeCode Available
When Vision Fails: Text Attacks Against ViT and OCR	Jun 12, 2023	Optical Character Recognition (OCR)	CodeCode Available
Predicting the Past: Estimating Historical Appraisals with OCR and Machine Learning	May 30, 2025	Optical Character Recognition (OCR)	CodeCode Available

Show:10 25 50

← PrevPage 22 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified