Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1209 papers

Title	Date	Tasks	Status
Grammatical vs Spelling Error Correction: An Investigation into the Responsiveness of Transformer-based Language Models using BART and MarianMT	Mar 25, 2024	Optical Character Recognition (OCR)speech-recognition	—Unverified
Ground Truth for training OCR engines on historical documents in German Fraktur and Early Modern Latin	Sep 14, 2018	Optical Character Recognition (OCR)	—Unverified
Grouping Language Model Boundary Words to Speed K--Best Extraction from Hypergraphs	Jun 1, 2013	Language ModelingLanguage Modelling	—Unverified
GroupLink: An End-to-end Multitask Method for Word Grouping and Relation Extraction in Form Understanding	May 10, 2021	FormOptical Character Recognition (OCR)	—Unverified
GUI Action Narrator: Where and When Did That Action Take Place?	Jun 19, 2024	Optical Character Recognition (OCR)Video Captioning	—Unverified
Guidelines for External Disturbance Factors in the Use of OCR in Real-World Environments	Apr 21, 2025	Optical Character Recognition (OCR)	—Unverified
Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition	Sep 23, 2020	DecoderOptical Character Recognition (OCR)	—Unverified
HAMMR: HierArchical MultiModal React agents for generic VQA	Apr 8, 2024	Optical Character Recognition (OCR)Question Answering	—Unverified
Handwriting Recognition in Historical Documents with Multimodal LLM	Oct 31, 2024	Handwriting RecognitionOptical Character Recognition	—Unverified
Handwritten and Machine printed OCR for Geez Numbers Using Artificial Neural Network	Nov 15, 2019	Image RetrievalOptical Character Recognition (OCR)	—Unverified
Handwritten and Printed Text Segmentation: A Signature Case Study	Jul 15, 2023	Binary ClassificationOptical Character Recognition	—Unverified
Handwritten Character Generation using Y-Autoencoder for Character Recognition Model Training	Jun 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Handwritten Digit Recognition Using Improved Bounding Box Recognition Technique	Nov 10, 2021	BIG-bench Machine LearningHandwritten Digit Recognition	—Unverified
Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)	Jan 1, 2020	ArticlesOptical Character Recognition	—Unverified
Handwritten Script Identification from Text Lines	Sep 16, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Handwritten Text Recognition Using Convolutional Neural Network	Jul 11, 2023	Handwritten Text RecognitionOptical Character Recognition	—Unverified
Handwritten Urdu Character Recognition using 1-Dimensional BLSTM Classifier	May 15, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Harnessing PDF Data for Improving Japanese Large Multimodal Models	Feb 20, 2025	Optical Character Recognition (OCR)	—Unverified
Harnessing Webpage UIs for Text-Rich Visual Understanding	Oct 17, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
HAUR: Human Annotation Understanding and Recognition Through Text-Heavy Images	Dec 24, 2024	Optical Character Recognition (OCR)Question Answering	—Unverified
Hierarchical Visual Feature Aggregation for OCR-Free Document Understanding	Nov 8, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
HIP: Hierarchical Point Modeling and Pre-training for Visual Information Extraction	Nov 2, 2024	Image ReconstructionOptical Character Recognition (OCR)	—Unverified
HoughNet: neural network architecture for vanishing points detection	Sep 9, 2019	Optical Character Recognition (OCR)	—Unverified
How Do Large Vision-Language Models See Text in Image? Unveiling the Distinctive Role of OCR Heads	May 21, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites	Apr 25, 2024	4kLanguage Modeling	—Unverified
How many faces can be recognized? Performance extrapolation for multi-class classification	Jun 16, 2016	General ClassificationMulti-class Classification	—Unverified
How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified
ICDAR2019 Competition on Scanned Receipt OCR and Information Extraction	Mar 18, 2021	Key Information ExtractionOptical Character Recognition (OCR)	—Unverified
ICDAR 2023 Competition on Reading the Seal Title	Apr 24, 2023	Optical Character Recognition (OCR)Task 2	—Unverified
Ice hockey player identification via transformers and weakly supervised learning	Nov 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Identifying OCRs in cfDNA WGS Data by Correlation Clustering	Feb 19, 2022	Clusteringgraph construction	—Unverified
Image-based Natural Language Understanding Using 2D Convolutional Neural Networks	Oct 24, 2018	ClassificationGeneral Classification	—Unverified
Image preprocessing and modified adaptive thresholding for improving OCR	Nov 28, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Image Processing Based Scene-Text Detection and Recognition with Tesseract	Apr 17, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Implementation of a Workflow Management System for Non-Expert Users	Dec 1, 2016	ManagementOptical Character Recognition (OCR)	—Unverified
Important New Developments in Arabographic Optical Character Recognition (OCR)	Mar 28, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Improve CAPTCHA's Security Using Gaussian Blur Filter	Oct 16, 2014	Optical Character Recognition (OCR)	—Unverified
Improved Typesetting Models for Historical OCR	Jun 1, 2014	Optical Character Recognition (OCR)	—Unverified
Improvement in Semantic Address Matching using Natural Language Processing	Apr 17, 2024	Optical Character Recognition (OCR)	—Unverified
Improve Sentence Alignment by Divide-and-conquer	Jan 18, 2022	Optical Character Recognition (OCR)Sentence	—Unverified
Improving Amharic Handwritten Word Recognition Using Auxiliary Task	Feb 25, 2022	Handwritten Text RecognitionOptical Character Recognition	—Unverified
Improving Document Clustering by Removing Unnatural Language	Sep 1, 2017	ClusteringDocument Layout Analysis	—Unverified
Improving Handwritten OCR with Training Samples Generated by Glyph Conditional Denoising Diffusion Probabilistic Model	May 31, 2023	DenoisingOptical Character Recognition (OCR)	—Unverified
Improving Inference Performance of Machine Learning with the Divide-and-Conquer Principle	Jan 12, 2023	CPUOptical Character Recognition	—Unverified
Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory	Nov 5, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Improving OCR-Based Image Captioning by Incorporating Geometrical Relationship	Jun 19, 2021	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Improving OCR Quality in 19th Century Historical Documents Using a Combined Machine Learning Based Approach	Jan 15, 2024	Optical Character Recognition (OCR)	—Unverified
Improving Optical Character Recognition of Finnish Historical Newspapers with a Combination of Fraktur \& Antiqua Models and Image Preprocessing	May 1, 2017	Boundary DetectionInformation Retrieval	—Unverified
Improving Text Generation on Images with Synthetic Captions	Jun 1, 2024	Optical Character Recognition (OCR)Text Generation	—Unverified
IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Text Detection	May 3, 2018	Multi-Oriented Scene Text Detectionobject-detection	—Unverified

Show:10 25 50

← PrevPage 23 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified