Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1075 of 1209 papers

Title	Date	Tasks	Status
LMV-RPA: Large Model Voting-based Robotic Process Automation	Dec 23, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Automatic Metadata Extraction Incorporating Visual Features from Scanned Electronic Theses and Dissertations	Jul 1, 2021	Key Information ExtractionOptical Character Recognition (OCR)	CodeCode Available
An Open Source Contractual Language Understanding Application Using Machine Learning	Jun 1, 2022	Document Text ClassificationInformation Retrieval	CodeCode Available
Document Image Cleaning using Budget-Aware Black-Box Approximation	Jun 22, 2023	Optical Character Recognition (OCR)	CodeCode Available
iExam: A Novel Online Exam Monitoring and Analysis System Based on Face Detection and Recognition	Jun 27, 2022	Face DetectionFace Recognition	CodeCode Available
Alleviating Digitization Errors in Named Entity Recognition for Historical Documents	Nov 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available
An OCR system for the Unified Northern Alphabet	Jan 1, 2019	Optical Character Recognition (OCR)	CodeCode Available
Parallel Iterative Edit Models for Local Sequence Transduction	Oct 7, 2019	DecoderGrammatical Error Correction	CodeCode Available
CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models	Aug 30, 2024	Articlesnamed-entity-recognition	CodeCode Available
PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents	May 1, 2018	Coreference ResolutionOptical Character Recognition (OCR)	CodeCode Available
Cleaning Dirty Books: Post-OCR Processing for Previously Scanned Texts	Oct 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Arrow-Guided VLM: Enhancing Flowchart Understanding via Arrow Direction Encoding	May 9, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation	Jun 12, 2024	Document Level Machine TranslationDocument Translation	CodeCode Available
A Data-driven Investigation of Euphemistic Language: Comparing the usage of "slave" and "servant" in 19th century US newspapers	Mar 19, 2025	Optical Character Recognition (OCR)	CodeCode Available
DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation	Jun 25, 2024	Computational EfficiencyOptical Character Recognition (OCR)	CodeCode Available
Historical Ink: 19th Century Latin American Spanish Newspaper Corpus with LLM OCR Correction	Jul 4, 2024	Language ModelingLanguage Modelling	CodeCode Available
Adapting the Tesseract Open Source OCR Engine for Multilingual OCR	Jul 25, 2009	Optical Character Recognition (OCR)	CodeCode Available
Augmented Math: Authoring AR-Based Explorable Explanations by Augmenting Static Math Textbooks	Jul 30, 2023	MathOptical Character Recognition	CodeCode Available
High-Throughput Phenotyping using Computer Vision and Machine Learning	Jul 8, 2024	Image SegmentationOptical Character Recognition	CodeCode Available
HENet: Forcing a Network to Think More for Font Recognition	Oct 21, 2021	Font RecognitionOptical Character Recognition (OCR)	CodeCode Available
DLaVA: Document Language and Vision Assistant for Answer Localization with Enhanced Interpretability and Trustworthiness	Nov 29, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network	Apr 12, 2021	DecoderOptical Character Recognition (OCR)	CodeCode Available
PHD: Pixel-Based Language Modeling of Historical Documents	Oct 22, 2023	Language ModelingLanguage Modelling	CodeCode Available
MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features	Sep 25, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Handwritten Text Segmentation via End-to-End Learning of Convolutional Neural Network	Jun 12, 2019	Optical Character Recognition (OCR)Text Segmentation	CodeCode Available

Show:10 25 50

← PrevPage 43 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified