Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 1209 papers

Title	Date	Tasks	Status
A Possibilistic Approach for Automatic Word Sense Disambiguation	Sep 1, 2012	Information RetrievalOptical Character Recognition (OCR)	—Unverified
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images	Jan 16, 2025	De-identificationOptical Character Recognition	—Unverified
GlyphMastero: A Glyph Encoder for High-Fidelity Scene Text Editing	May 8, 2025	Optical Character Recognition (OCR)Scene Text Editing	—Unverified
GMN: Generative Multi-modal Network for Practical Document Information Extraction	Jul 11, 2022	Optical Character Recognition (OCR)	—Unverified
Exploiter des mod\`eles de langue pour \'evaluer des sorties de logiciels d'OCR pour des documents fran du XVIIe si\`ecle ()	Jun 1, 2020	Optical Character Recognition (OCR)	—Unverified
TextSleuth: Towards Explainable Tampered Text Detection	Dec 19, 2024	Domain GeneralizationOptical Character Recognition (OCR)	—Unverified
Challenging America: Modeling language in longer time scales	Jul 1, 2022	Cloze TestOptical Character Recognition (OCR)	—Unverified
A Panoramic Survey of Natural Language Processing in the Arab World	Nov 25, 2020	Machine TranslationOptical Character Recognition	—Unverified
Grouping Language Model Boundary Words to Speed K--Best Extraction from Hypergraphs	Jun 1, 2013	Language ModelingLanguage Modelling	—Unverified
GroupLink: An End-to-end Multitask Method for Word Grouping and Relation Extraction in Form Understanding	May 10, 2021	FormOptical Character Recognition (OCR)	—Unverified
A Language Modelling Approach to Quality Assessment of OCR’ed Historical Text	Jun 1, 2022	Language ModelingLanguage Modelling	—Unverified
Explainable Publication Year Prediction of Eighteenth Century Texts with the BERT Model	May 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Every Pixel Tells a Story: End-to-End Urdu Newspaper OCR	May 20, 2025	ArticlesImage Super-Resolution	—Unverified
Challenging America: Modeling language in longer time scales	Dec 17, 2021	Cloze TestOptical Character Recognition (OCR)	—Unverified
Evaluating Usage of Images for App Classification	Dec 16, 2019	ClassificationGeneral Classification	—Unverified
CG-DIQA: No-reference Document Image Quality Assessment Based on Character Gradient	Jul 11, 2018	Document Image Quality AssessmentImage Quality Assessment	—Unverified
Evaluating Inter-Annotator Agreement on Historical Spelling Normalization	Aug 1, 2016	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
Evaluating BERT-based Scientific Relation Classifiers for Scholarly Knowledge Graph Construction on Digital Library Collections	May 3, 2023	graph constructionOptical Character Recognition	—Unverified
Estimating Post-OCR Denoising Complexity on Numerical Texts	Jul 3, 2023	DenoisingOptical Character Recognition (OCR)	—Unverified
ERPA: Efficient RPA Model Integrating OCR and LLMs for Intelligent Document Processing	Dec 24, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy	Dec 3, 2024	HallucinationKey Information Extraction	—Unverified
Adapting Multilingual Embedding Models to Historical Luxembourgish	Feb 11, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
EraseNet: A Recurrent Residual Network for Supervised Document Cleaning	Oct 3, 2022	DenoisingOptical Character Recognition	—Unverified
Entropy Heat-Mapping: Localizing GPT-Based OCR Errors with Sliding-Window Shannon Analysis	Apr 30, 2025	Optical Character Recognition (OCR)	—Unverified
Enhancing Vehicle Entrance and Parking Management: Deep Learning Solutions for Efficiency and Security	Dec 5, 2023	Face DetectionLicense Plate Recognition	—Unverified

Show:10 25 50

← PrevPage 21 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified