Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 876–900 of 1209 papers

Title	Date	Tasks	Status
MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding	Aug 14, 2021	Key Information Extractionnamed-entity-recognition	—Unverified
MMR: Evaluating Reading Ability of Large Multimodal Models	Aug 26, 2024	Font RecognitionMMR total	—Unverified
Morphological annotation of Old and Middle Hungarian corpora	Aug 1, 2013	Optical Character Recognition (OCR)	—Unverified
mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding	Mar 19, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
mPLUG-DocOwl2: High-resolution Compressing for OCR-free Multi-page Document Understanding	Sep 5, 2024	document understandingGPU	—Unverified
mPLUG-DocOwl: Modularized Multimodal Large Language Model for Document Understanding	Jul 4, 2023	document understandingLanguage Modeling	—Unverified
MT^3: Scaling MLLM-based Text Image Machine Translation via Multi-Task Reinforcement Learning	May 26, 2025	document understandingMachine Translation	—Unverified
MultiCoNER v2: a Large Multilingual dataset for Fine-grained and Noisy Named Entity Recognition	Oct 20, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation	Jun 16, 2025	Optical Character Recognition (OCR)	—Unverified
Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition	Jul 25, 2023	Language ModellingOptical Character Recognition (OCR)	—Unverified
Multi-Input Attention for Unsupervised OCR Correction	Jul 1, 2018	DecoderOptical Character Recognition (OCR)	—Unverified
Multikernel activation functions: formulation and a case study	Jan 29, 2019	Optical Character Recognition (OCR)	—Unverified
Multilingual Named Entity Recognition for Medieval Charters Using Stacked Embeddings and Bert-based Models.	Jun 1, 2022	HTRMultilingual Named Entity Recognition	—Unverified
Multimodal Sentiment Analysis: Perceived vs Induced Sentiments	Dec 12, 2023	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified
Multimodal Short Video Rumor Detection System Based on Contrastive Learning	Apr 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multimodal Transformer for Comics Text-Cloze	Mar 6, 2024	Language ModelingLanguage Modelling	—Unverified
Multi-modular domain-tailored OCR post-correction	Sep 1, 2017	DiversityMachine Translation	—Unverified
Multiple-Question Multiple-Answer Text-VQA	Nov 15, 2023	DecoderDenoising	—Unverified
Multistage Curvilinear Coordinate Transform Based Document Image Dewarping using a Novel Quality Estimator	Mar 15, 2020	Optical Character Recognition (OCR)	—Unverified
Multistep Automated Data Labelling Procedure (MADLaP) for Thyroid Nodules on Ultrasound: An Artificial Intelligence Approach for Automating Image Annotation	Jun 28, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Multi-Task Learning for Improved Discriminative Training in SMT	Aug 1, 2013	Machine TranslationMulti-Task Learning	—Unverified
Named Entity Recognition and Correction in OCRized Corpora (D\'etection et correction automatique d'entit\'es nomm\'ees dans des corpus OCRis\'es) [in French]	Jul 1, 2014	named-entity-recognitionNamed Entity Recognition	—Unverified
Named Entity Recognition in Historic Legal Text: A Transformer and State Machine Ensemble Method	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified
Named Entity Recognition in the Legal Domain using a Pointer Generator Network	Dec 17, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
NeKo: Toward Post Recognition Generative Correction Large Language Models with Task-Oriented Experts	Nov 8, 2024	Mixture-of-ExpertsOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 36 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
2	DTrOCR	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified