Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–875 of 1209 papers

Title	Date	Tasks	Status
Making the V in Text-VQA Matter	Aug 1, 2023	Optical Character Recognition (OCR)TextVQA	—Unverified
MaskOCR: Text Recognition with Masked Encoder-Decoder Pretraining	Jun 1, 2022	DecoderLanguage Modeling	—Unverified
MataDoc: Margin and Text Aware Document Dewarping for Arbitrary Boundary	Jul 24, 2023	document understandingOptical Character Recognition (OCR)	—Unverified
MathWriting: A Dataset For Handwritten Mathematical Expression Recognition	Apr 16, 2024	FormOptical Character Recognition (OCR)	—Unverified
Matics Software Suite: New Tools for Evaluation and Data Exploration	May 1, 2018	Optical Character Recognition (OCR)Speaker Diarization	—Unverified
MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten Compound Characters	Apr 29, 2020	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified
Measuring Contextual Fitness Using Error Contexts Extracted from the Wikipedia Revision History	Apr 1, 2012	Optical Character Recognition (OCR)Speech Recognition	—Unverified
Measuring Innovation in Speech and Language Processing Publications.	May 1, 2018	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Measuring Lexical Quality of a Historical Finnish Newspaper Collection â€• Analysis of Garbled OCR Data with Basic Language Technology Tools and Means	May 1, 2016	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Membership Model Inversion Attacks for Deep Networks	Oct 9, 2019	modelOptical Character Recognition (OCR)	—Unverified
Meme Sentiment Analysis Enhanced with Multimodal Spatial Encoding and Facial Embedding	Mar 3, 2023	Optical Character Recognition (OCR)Position	—Unverified
Memes in the Wild: Assessing the Generalizability of the Hateful Memes Challenge Dataset	Jul 9, 2021	Optical Character Recognition (OCR)	—Unverified
MenuAI: Restaurant Food Recommendation System via a Transformer-based Deep Learning Model	Oct 15, 2022	Food recommendationLearning-To-Rank	—Unverified
Mero Nagarikta: Advanced Nepali Citizenship Data Extractor with Deep Learning-Powered Text Detection and OCR	Oct 8, 2024	object-detectionObject Detection	—Unverified
MinD at SemEval-2021 Task 6: Propaganda Detection using Transfer Learning and Multimodal Fusion	Aug 1, 2021	Optical Character Recognition (OCR)Propaganda detection	—Unverified
Mind the Gap: Analyzing Lacunae with Transformer-Based Transcription	Jun 28, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active Learning	May 12, 2021	Active LearningOptical Character Recognition	—Unverified
MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions	Oct 13, 2024	Handwriting RecognitionOptical Character Recognition	—Unverified
Mitigating Noisy Inputs for Question Answering	Aug 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mixed Model OCR Training on Historical Latin Script for Out-of-the-Box Recognition and Finetuning	Jun 15, 2021	Data AugmentationOptical Character Recognition	—Unverified
MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning	Sep 30, 2024	Mixture-of-ExpertsOptical Character Recognition (OCR)	—Unverified
MMDocBench: Benchmarking Large Vision-Language Models for Fine-Grained Visual Document Understanding	Oct 25, 2024	Benchmarkingdocument understanding	—Unverified
MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents	Jan 15, 2025	BenchmarkingOptical Character Recognition (OCR)	—Unverified
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency	Feb 13, 2025	BenchmarkingMath	—Unverified
MME-Industry: A Cross-Industry Multimodal Evaluation Benchmark	Jan 28, 2025	MMEModel Optimization	—Unverified

Show:10 25 50

← PrevPage 35 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified