Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1209 papers

Title	Date	Tasks	Status
Making the V in Text-VQA Matter	Aug 1, 2023	Optical Character Recognition (OCR)TextVQA	—Unverified
MaskOCR: Text Recognition with Masked Encoder-Decoder Pretraining	Jun 1, 2022	DecoderLanguage Modeling	—Unverified
MataDoc: Margin and Text Aware Document Dewarping for Arbitrary Boundary	Jul 24, 2023	document understandingOptical Character Recognition (OCR)	—Unverified
MathWriting: A Dataset For Handwritten Mathematical Expression Recognition	Apr 16, 2024	FormOptical Character Recognition (OCR)	—Unverified
Matics Software Suite: New Tools for Evaluation and Data Exploration	May 1, 2018	Optical Character Recognition (OCR)Speaker Diarization	—Unverified
MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten Compound Characters	Apr 29, 2020	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified
Measuring Contextual Fitness Using Error Contexts Extracted from the Wikipedia Revision History	Apr 1, 2012	Optical Character Recognition (OCR)Speech Recognition	—Unverified
Measuring Innovation in Speech and Language Processing Publications.	May 1, 2018	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Measuring Lexical Quality of a Historical Finnish Newspaper Collection â€• Analysis of Garbled OCR Data with Basic Language Technology Tools and Means	May 1, 2016	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Membership Model Inversion Attacks for Deep Networks	Oct 9, 2019	modelOptical Character Recognition (OCR)	—Unverified
Meme Sentiment Analysis Enhanced with Multimodal Spatial Encoding and Facial Embedding	Mar 3, 2023	Optical Character Recognition (OCR)Position	—Unverified
Memes in the Wild: Assessing the Generalizability of the Hateful Memes Challenge Dataset	Jul 9, 2021	Optical Character Recognition (OCR)	—Unverified
MenuAI: Restaurant Food Recommendation System via a Transformer-based Deep Learning Model	Oct 15, 2022	Food recommendationLearning-To-Rank	—Unverified
Mero Nagarikta: Advanced Nepali Citizenship Data Extractor with Deep Learning-Powered Text Detection and OCR	Oct 8, 2024	object-detectionObject Detection	—Unverified
MinD at SemEval-2021 Task 6: Propaganda Detection using Transfer Learning and Multimodal Fusion	Aug 1, 2021	Optical Character Recognition (OCR)Propaganda detection	—Unverified
Mind the Gap: Analyzing Lacunae with Transformer-Based Transcription	Jun 28, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active Learning	May 12, 2021	Active LearningOptical Character Recognition	—Unverified
MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions	Oct 13, 2024	Handwriting RecognitionOptical Character Recognition	—Unverified
Mitigating Noisy Inputs for Question Answering	Aug 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mixed Model OCR Training on Historical Latin Script for Out-of-the-Box Recognition and Finetuning	Jun 15, 2021	Data AugmentationOptical Character Recognition	—Unverified
MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning	Sep 30, 2024	Mixture-of-ExpertsOptical Character Recognition (OCR)	—Unverified
MMDocBench: Benchmarking Large Vision-Language Models for Fine-Grained Visual Document Understanding	Oct 25, 2024	Benchmarkingdocument understanding	—Unverified
MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents	Jan 15, 2025	BenchmarkingOptical Character Recognition (OCR)	—Unverified
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency	Feb 13, 2025	BenchmarkingMath	—Unverified
MME-Industry: A Cross-Industry Multimodal Evaluation Benchmark	Jan 28, 2025	MMEModel Optimization	—Unverified
MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding	Aug 14, 2021	Key Information Extractionnamed-entity-recognition	—Unverified
MMR: Evaluating Reading Ability of Large Multimodal Models	Aug 26, 2024	Font RecognitionMMR total	—Unverified
Morphological annotation of Old and Middle Hungarian corpora	Aug 1, 2013	Optical Character Recognition (OCR)	—Unverified
mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding	Mar 19, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
mPLUG-DocOwl2: High-resolution Compressing for OCR-free Multi-page Document Understanding	Sep 5, 2024	document understandingGPU	—Unverified
mPLUG-DocOwl: Modularized Multimodal Large Language Model for Document Understanding	Jul 4, 2023	document understandingLanguage Modeling	—Unverified
MT^3: Scaling MLLM-based Text Image Machine Translation via Multi-Task Reinforcement Learning	May 26, 2025	document understandingMachine Translation	—Unverified
MultiCoNER v2: a Large Multilingual dataset for Fine-grained and Noisy Named Entity Recognition	Oct 20, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation	Jun 16, 2025	Optical Character Recognition (OCR)	—Unverified
Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition	Jul 25, 2023	Language ModellingOptical Character Recognition (OCR)	—Unverified
Multi-Input Attention for Unsupervised OCR Correction	Jul 1, 2018	DecoderOptical Character Recognition (OCR)	—Unverified
Multikernel activation functions: formulation and a case study	Jan 29, 2019	Optical Character Recognition (OCR)	—Unverified
Multilingual Named Entity Recognition for Medieval Charters Using Stacked Embeddings and Bert-based Models.	Jun 1, 2022	HTRMultilingual Named Entity Recognition	—Unverified
Multimodal Sentiment Analysis: Perceived vs Induced Sentiments	Dec 12, 2023	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified
Multimodal Short Video Rumor Detection System Based on Contrastive Learning	Apr 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multimodal Transformer for Comics Text-Cloze	Mar 6, 2024	Language ModelingLanguage Modelling	—Unverified
Multi-modular domain-tailored OCR post-correction	Sep 1, 2017	DiversityMachine Translation	—Unverified
Multiple-Question Multiple-Answer Text-VQA	Nov 15, 2023	DecoderDenoising	—Unverified
Multistage Curvilinear Coordinate Transform Based Document Image Dewarping using a Novel Quality Estimator	Mar 15, 2020	Optical Character Recognition (OCR)	—Unverified
Multistep Automated Data Labelling Procedure (MADLaP) for Thyroid Nodules on Ultrasound: An Artificial Intelligence Approach for Automating Image Annotation	Jun 28, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Multi-Task Learning for Improved Discriminative Training in SMT	Aug 1, 2013	Machine TranslationMulti-Task Learning	—Unverified
Named Entity Recognition and Correction in OCRized Corpora (D\'etection et correction automatique d'entit\'es nomm\'ees dans des corpus OCRis\'es) [in French]	Jul 1, 2014	named-entity-recognitionNamed Entity Recognition	—Unverified
Named Entity Recognition in Historic Legal Text: A Transformer and State Machine Ensemble Method	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified
Named Entity Recognition in the Legal Domain using a Pointer Generator Network	Dec 17, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
NeKo: Toward Post Recognition Generative Correction Large Language Models with Task-Oriented Experts	Nov 8, 2024	Mixture-of-ExpertsOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 18 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified