Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 1209 papers

Title	Date	Tasks	Status	Score
HENet: Forcing a Network to Think More for Font Recognition	Oct 21, 2021	Font RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Separate and Locate: Rethink the Text in Text-based Visual Question Answering	Aug 31, 2023	Optical Character Recognition (OCR)Position	CodeCode Available	5
Analyzing Green View Index and Green View Index best path using Google Street View and deep learning	Apr 26, 2021	Optical Character Recognition (OCR)Semantic Segmentation	CodeCode Available	5
Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia)	Dec 1, 2020	Optical Character Recognition (OCR)POS	CodeCode Available	5
Handwriting Classification for the Analysis of Art-Historical Documents	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available	5
Efficient Multi-domain Text Recognition Deep Neural Network Parameterization with Residual Adapters	Jan 1, 2024	Multi-Task LearningOptical Character Recognition	CodeCode Available	5
A Multi-Object Rectified Attention Network for Scene Text Recognition	Jan 10, 2019	DecoderObject	CodeCode Available	5
GeoContrastNet: Contrastive Key-Value Edge Learning for Language-Agnostic Document Understanding	May 6, 2024	Contrastive Learningdocument understanding	CodeCode Available	5
Efficient Video-Based ALPR System Using YOLO and Visual Rhythm	Jan 4, 2025	License Plate RecognitionOptical Character Recognition	CodeCode Available	5
Ekush: A Multipurpose and Multitype Comprehensive Database for Online Off-Line Bangla Handwritten Characters	Jul 17, 2019	Optical Character Recognition (OCR)	CodeCode Available	5
Handwritten Code Recognition for Pen-and-Paper CS Education	Aug 7, 2024	HallucinationLanguage Modeling	CodeCode Available	5
Empirical Error Modeling Improves Robustness of Noisy Neural Sequence Labeling	May 25, 2021	Language ModelingLanguage Modelling	CodeCode Available	5
Calibrated Structured Prediction	Dec 1, 2015	Medical DiagnosisOptical Character Recognition	CodeCode Available	5
Implicit Language Model in LSTM for OCR	May 23, 2018	Language ModelingLanguage Modelling	CodeCode Available	5
Gated Recurrent Convolution Neural Network for OCR	Dec 1, 2017	General Classificationimage-classification	CodeCode Available	5
A Survey of Deep Learning Approaches for OCR and Document Understanding	Nov 27, 2020	document understandingOptical Character Recognition (OCR)	CodeCode Available	5
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification	Jun 25, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
From the Paft to the Fiiture: a Fully Automatic NMT and Word Embeddings Method for OCR Post-Correction	Oct 12, 2019	BIG-bench Machine LearningMachine Translation	CodeCode Available	5
Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway	Jan 13, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
From Videos to URLs: A Multi-Browser Guide To Extract User's Behavior with Optical Character Recognition	Nov 15, 2018	MarketingOptical Character Recognition	CodeCode Available	5
A Skip-connected Multi-column Network for Isolated Handwritten Bangla Character and Digit recognition	Apr 27, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
Combining OCR Models for Reading Early Modern Printed Books	May 11, 2023	Font RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
A model of diffuse Galactic Radio Emission from 10 MHz to 100 GHz	Feb 12, 2008	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
FastTextSpotter: A High-Efficiency Transformer for Multilingual Scene Text Spotting	Aug 27, 2024	BenchmarkingDecoder	CodeCode Available	5
COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images	Jan 26, 2016	DiversityGeneral Classification	CodeCode Available	5
FashionLOGO: Prompting Multimodal Large Language Models for Fashion Logo Embeddings	Aug 17, 2023	Image RetrievalLogo Recognition	CodeCode Available	5
FINN-L: Library Extensions and Design Trade-off Analysis for Variable Precision LSTM Networks on FPGAs	Jul 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	5
CMUQ@QALB-2014: An SMT-based System for Automatic Arabic Error Correction	Oct 1, 2014	Language ModellingMachine Translation	—Unverified	0
A semi-automatic method for document classification in the shipping industry	Mar 29, 2023	ClassificationDocument Classification	—Unverified	0
Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts	Nov 18, 2020	Clusteringnamed-entity-recognition	—Unverified	0
A second-order orientation-contrast stimulus for population-receptive-field-based retinotopic mapping	Jul 10, 2017	Optical Character Recognition (OCR)	—Unverified	0
Amazigh Verb Conjugator	May 1, 2014	Optical Character Recognition (OCR)	—Unverified	0
A Scalable Handwritten Text Recognition System	Apr 19, 2019	Handwriting RecognitionHandwritten Text Recognition	—Unverified	0
CLIP-ReIdent: Contrastive Training for Player Re-Identification	Mar 21, 2023	Optical Character Recognition (OCR)Sports Analytics	—Unverified	0
CLIP is Almost All You Need: Towards Parameter-Efficient Scene Text Retrieval without OCR	Jan 1, 2025	AllOptical Character Recognition	—Unverified	0
Artificial neural networks and fuzzy logic for recognizing alphabet characters and mathematical symbols	Jul 6, 2016	Image SegmentationOptical Character Recognition	—Unverified	0
A Maximum Entropy Approach to Chinese Spelling Check	Oct 1, 2013	Optical Character Recognition (OCR)	—Unverified	0
Cleansing Jewel: A Neural Spelling Correction Model Built On Google OCR-ed Tibetan Manuscripts	Apr 7, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Classroom Slide Narration System	Jan 21, 2022	Image SegmentationOptical Character Recognition	—Unverified	0
Classification of Documents Extracted from Images with Optical Character Recognition Methods	Jun 15, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
Classification of Contract-Amendment Relationships	Jun 8, 2021	ClassificationManagement	—Unverified	0
Chunk-based Chinese Spelling Check with Global Optimization	Nov 1, 2020	global-optimizationOptical Character Recognition	—Unverified	0
Artificial Eye for the Blind	Jul 7, 2023	Objectobject-detection	—Unverified	0
A Masked Bounding-Box Selection Based ResNet Predictor for Text Rotation Prediction	Sep 6, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
CHISPA on the GO: A mobile Chinese-Spanish translation service for travellers in trouble	Apr 1, 2014	Image RetrievalInformation Retrieval	—Unverified	0
Chinese/English mixed Character Segmentation as Semantic Segmentation	Nov 7, 2016	DiversityOptical Character Recognition (OCR)	—Unverified	0
A random forest system combination approach for error detection in digital dictionaries	Oct 30, 2014	Language ModelingLanguage Modelling	—Unverified	0
A Linked Data Model for Multimodal Sentiment and Emotion Analysis	Jul 1, 2015	Emotion RecognitionOpinion Mining	—Unverified	0
ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints	May 8, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Chaurah: A Smart Raspberry Pi based Parking System	Dec 28, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 9 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified