Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–375 of 1209 papers

Title	Date	Tasks	Status
Bengali Document Layout Analysis with Detectron2	Aug 26, 2023	Data AugmentationDocument Layout Analysis	—Unverified
An Energy Activity Dataset for Smart Homes	Aug 29, 2022	DiversityMiscellaneous	—Unverified
Enhancing Question Answering on Charts Through Effective Pre-training Tasks	Jun 14, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
Evaluating BERT-based Scientific Relation Classifiers for Scholarly Knowledge Graph Construction on Digital Library Collections	May 3, 2023	graph constructionOptical Character Recognition	—Unverified
Diversified Hidden Markov Models for Sequential Labeling	Apr 5, 2019	DiversityOptical Character Recognition	—Unverified
Bengali Document Layout Analysis -- A YOLOV8 Based Ensembling Approach	Sep 2, 2023	Data AugmentationDocument Layout Analysis	—Unverified
Between History and Natural Language Processing: Study, Enrichment and Online Publication of French Parliamentary Debates of the Early Third Republic (1881-1899)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
DisinfoMeme: A Multimodal Dataset for Detecting Meme Intentionally Spreading Out Disinformation	May 25, 2022	Multimodal ReasoningOptical Character Recognition (OCR)	—Unverified
DocPedia: Unleashing the Power of Large Multimodal Model in the Frequency Domain for Versatile Document Understanding	Nov 20, 2023	document understandingLanguage Modeling	—Unverified
An end-to-end Optical Character Recognition approach for ultra-low-resolution printed text images	May 10, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
DISGO: Automatic End-to-End Evaluation for Scene Text OCR	Aug 25, 2023	Machine TranslationOptical Character Recognition	—Unverified
DocStruct: A Multimodal Method to Extract Hierarchy Structure in Document for General Form Understanding	Oct 15, 2020	FormOptical Character Recognition (OCR)	—Unverified
DocSum: Domain-Adaptive Pre-training for Document Abstractive Summarization	Dec 11, 2024	Abstractive Text SummarizationDecision Making	—Unverified
Discriminative Dictionary Learning based on Statistical Methods	Nov 17, 2021	DenoisingDictionary Learning	—Unverified
Document Decomposition of Bangla Printed Text	Jan 27, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Benchmarking Algorithms for Automatic License Plate Recognition	Mar 27, 2022	BenchmarkingLicense Plate Recognition	—Unverified
Document Enhancement System Using Auto-encoders	Sep 14, 2019	DenoisingDocument Enhancement	—Unverified
Document Image Binarization in JPEG Compressed Domain using Dual Discriminator Generative Adversarial Networks	Sep 13, 2022	BinarizationOptical Character Recognition (OCR)	—Unverified
BIOfid Dataset: Publishing a German Gold Standard for Named Entity Recognition in Historical Biodiversity Literature	Nov 1, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified
Document Layout Analysis via Dynamic Residual Feature Fusion	Apr 7, 2021	Document Layout AnalysisOptical Character Recognition	—Unverified
Discovering Airline-Specific Business Intelligence from Online Passenger Reviews: An Unsupervised Text Analytics Approach	Dec 14, 2020	Opinion MiningOptical Character Recognition (OCR)	—Unverified
An Investigation into Pre-Training Object-Centric Representations for Reinforcement Learning	Feb 9, 2023	ObjectOptical Character Recognition (OCR)	—Unverified
DocVLM: Make Your VLM an Efficient Reader	Dec 11, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond	Oct 19, 2023	Document AIDocument Layout Analysis	—Unverified
Directional Global Three-part Image Decomposition	Oct 6, 2015	Image CompressionOptical Character Recognition	—Unverified

Show:10 25 50

← PrevPage 15 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified