Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 1209 papers

Title	Date	Tasks	Status	Score
Character decomposition to resolve class imbalance problem in Hangul OCR	Aug 12, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Chandojnanam: A Sanskrit Meter Identification and Utilization System	Sep 29, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Mining Spatio-temporal Data on Industrialization from Historical Registries	Dec 3, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features	Sep 25, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
AON: Towards Arbitrarily-Oriented Text Recognition	Nov 12, 2017	DecoderOptical Character Recognition	CodeCode Available	5
Centurio: On Drivers of Multilingual Ability of Large Vision-Language Model	Jan 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	5
AiM: Taking Answers in Mind to Correct Chinese Cloze Tests in Educational Applications	Aug 26, 2022	Optical Character Recognition (OCR)	CodeCode Available	5
Measuring Intersectional Biases in Historical Documents	May 21, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
An Unsupervised Normalization Algorithm for Noisy Text: A Case Study for Information Retrieval and Stance Detection	Jan 9, 2021	Information RetrievalOptical Character Recognition (OCR)	CodeCode Available	5
Case Study of a highly automated Layout Analysis and OCR of an incunabulum: 'Der Heiligen Leben' (1488)	Jan 20, 2017	Optical Character Recognition (OCR)	CodeCode Available	5
An Unsupervised Model of Orthographic Variation for Historical Document Transcription	Jun 1, 2016	Optical Character Recognition (OCR)	CodeCode Available	5
M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation	Jun 12, 2024	Document Level Machine TranslationDocument Translation	CodeCode Available	5
LILA-BOTI : Leveraging Isolated Letter Accumulations By Ordering Teacher Insights for Bangla Handwriting Recognition	May 23, 2022	Handwriting RecognitionKnowledge Distillation	CodeCode Available	5
LMV-RPA: Large Model Voting-based Robotic Process Automation	Dec 23, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Calibrated Structured Prediction	Dec 1, 2015	Medical DiagnosisOptical Character Recognition	CodeCode Available	5
Calamari - A High-Performance Tensorflow-based Deep Learning Package for Optical Character Recognition	Jul 5, 2018	GPUOptical Character Recognition	CodeCode Available	5
Answering Questions about Data Visualizations using Efficient Bimodal Fusion	Aug 5, 2019	Chart Question AnsweringOptical Character Recognition	CodeCode Available	5
LEGAL-UQA: A Low-Resource Urdu-English Dataset for Legal Question Answering	Oct 16, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available	5
Levenshtein OCR	Sep 8, 2022	Imitation LearningOptical Character Recognition (OCR)	CodeCode Available	5
Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia)	Dec 1, 2020	Optical Character Recognition (OCR)POS	CodeCode Available	5
Latent Tree Language Model	Nov 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	CodeCode Available	5
LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images	Dec 16, 2022	DecoderOptical Character Recognition (OCR)	CodeCode Available	5
KAP: MLLM-assisted OCR Text Enhancement for Hybrid Retrieval in Chinese Non-Narrative Documents	Mar 11, 2025	Optical Character Recognition (OCR)Retrieval	CodeCode Available	5
KL3M Tokenizers: A Family of Domain-Specific and Character-Level Tokenizers for Legal, Financial, and Preprocessing Applications	Mar 21, 2025	16k4k	CodeCode Available	5
A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check	Oct 1, 2018	Language ModelingLanguage Modelling	CodeCode Available	5
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription	Feb 27, 2025	Handwritten Text RecognitionHTR	CodeCode Available	5
Brno Mobile OCR Dataset	Jul 2, 2019	BinarizationDenoising	CodeCode Available	5
An Open Source Contractual Language Understanding Application Using Machine Learning	Jun 1, 2022	Document Text ClassificationInformation Retrieval	CodeCode Available	5
Optimal Projections for Discriminative Dictionary Learning using the JL-lemma	Aug 27, 2023	Dictionary LearningDimensionality Reduction	CodeCode Available	5
Advancing Post-OCR Correction: A Comparative Study of Synthetic Data	Aug 5, 2024	Optical Character Recognition (OCR)Synthetic Data Generation	CodeCode Available	5
It Takes Two to Tango: Combining Visual and Textual Information for Detecting Duplicate Video-Based Bug Reports	Jan 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Jochre 3 and the Yiddish OCR corpus	Jan 14, 2025	Optical Character Recognition (OCR)	CodeCode Available	5
LAREX - A semi-automatic open-source Tool for Layout Analysis and Region Extraction on Early Printed Books	Jan 20, 2017	Optical Character Recognition (OCR)	CodeCode Available	5
License Plate Detection and Recognition in Unconstrained Scenarios	Sep 1, 2018	License Plate DetectionLicense Plate Recognition	CodeCode Available	5
Mobile User Interface Element Detection Via Adaptively Prompt Tuning	May 16, 2023	object-detectionObject Detection	CodeCode Available	5
Order-preserving Consistency Regularization for Domain Adaptation and Generalization	Sep 23, 2023	Data AugmentationDomain Adaptation	CodeCode Available	5
Improving patch-based scene text script identification with ensembles of conjoined networks	Feb 24, 2016	General ClassificationOptical Character Recognition (OCR)	CodeCode Available	5
Indiscapes: Instance Segmentation Networks for Layout Parsing of Historical Indic Manuscripts	Dec 15, 2019	DiversityInstance Segmentation	CodeCode Available	5
Improving OCR Accuracy on Early Printed Books using Deep Convolutional Networks	Feb 27, 2018	Optical Character Recognition (OCR)	CodeCode Available	5
An OCR system for the Unified Northern Alphabet	Jan 1, 2019	Optical Character Recognition (OCR)	CodeCode Available	5
Improving OCR Accuracy on Early Printed Books by utilizing Cross Fold Training and Voting	Nov 27, 2017	Optical Character Recognition (OCR)	CodeCode Available	5
Infinity Parser: Layout Aware Reinforcement Learning for Scanned Document Parsing	Jun 1, 2025	Document AIdocument understanding	CodeCode Available	5
Implicit Language Model in LSTM for OCR	May 23, 2018	Language ModelingLanguage Modelling	CodeCode Available	5
A Gaussian Process Upsampling Model for Improvements in Optical Character Recognition	May 7, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Binary Document Image Super Resolution for Improved Readability and OCR Performance	Dec 6, 2018	Image Super-ResolutionInformation Retrieval	CodeCode Available	5
Improving OCR Accuracy on Early Printed Books by combining Pretraining, Voting, and Active Learning	Feb 27, 2018	Active LearningOptical Character Recognition (OCR)	CodeCode Available	5
InstructOCR: Instruction Boosting Scene Text Spotting	Dec 20, 2024	Optical Character Recognition (OCR)Text Spotting	CodeCode Available	5
An Evaluation of OCR on Egocentric Data	Jun 11, 2022	Optical Character Recognition (OCR)	CodeCode Available	5
BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction	Mar 25, 2025	document understandingobject-detection	CodeCode Available	5
iExam: A Novel Online Exam Monitoring and Analysis System Based on Face Detection and Recognition	Jun 27, 2022	Face DetectionFace Recognition	CodeCode Available	5

Show:10 25 50

← PrevPage 6 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified