Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1209 papers

Title	Date	Tasks	Status
Optical Character Recognition and Transcription of Berber Signs from Images in a Low-Resource Language Amazigh	Mar 21, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Optical Character Recognition (OCR) for Telugu: Database, Algorithm and Application	Nov 20, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Optical character recognition quality affects perceived usefulness of historical newspaper clippings	Jun 1, 2022	ArticlesInformation Retrieval	—Unverified
Optical Character Recognition using Convolutional Neural Networks for Ashokan Brahmi Inscriptions	Dec 29, 2024	Data AugmentationImage Segmentation	—Unverified
Optical Character Recognition, Using K-Nearest Neighbors	Nov 5, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Optical Character Recognition, Word Segmentation, Sentence Segmentation, and Information Extraction for Historical and Literature Texts in Classical Chinese	Sep 1, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Optical Text Recognition in Nepali and Bengali: A Transformer-based Approach	Apr 3, 2024	DecoderMachine Translation	—Unverified
Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning	Jul 25, 2022	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
Optimizing the Neural Network Training for OCR Error Correction of Historical Hebrew Texts	Jul 30, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OSPC: Detecting Harmful Memes with Large Language Model as a Catalyst	Jun 14, 2024	Image CaptioningLanguage Modeling	—Unverified
Out-of-Candidate Rectification for Weakly Supervised Semantic Segmentation	Nov 22, 2022	Optical Character Recognition (OCR)Semantic Segmentation	—Unverified
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy for Visuomotor Imitation Learning	Nov 5, 2024	Continual LearningImitation Learning	—Unverified
Out-of-Vocabulary Challenge Report	Sep 14, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Overlay Text Extraction From TV News Broadcast	Apr 2, 2016	ArticlesOptical Character Recognition (OCR)	—Unverified
Overview of the 2017 ALTA Shared Task: Correcting OCR Errors	Dec 1, 2017	Optical Character Recognition (OCR)	—Unverified
PACMAN: a framework for pulse oximeter digit detection and reading in a low-resource setting	Dec 9, 2022	object-detectionObject Detection	—Unverified
PaddleOCR 3.0 Technical Report	Jul 8, 2025	document understandingKey Information Extraction	—Unverified
Page Stream Segmentation with Convolutional Neural Nets Combining Textual and Visual Features	Oct 9, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
PAM: Understanding Product Images in Cross Product Category Attribute Extraction	Jun 8, 2021	AttributeAttribute Extraction	—Unverified
papago: A Machine Translation Service with Word Sense Disambiguation and Currency Conversion	Dec 1, 2016	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Pay Voice: Point of Sale Recognition for Visually Impaired People	Dec 14, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
PDFdigest: an Adaptable Layout-Aware PDF-to-XML Textual Content Extractor for Scientific Articles	May 1, 2018	ArticlesNamed Entity Recognition (NER)	—Unverified
PdfTable: A Unified Toolkit for Deep Learning-Based Table Extraction	Sep 8, 2024	Deep LearningDocument Layout Analysis	—Unverified
PDF-to-Text Reanalysis for Linguistic Data Mining	May 1, 2018	Optical Character Recognition (OCR)	—Unverified
People and Places of Historical Europe: Bootstrapping Annotation Pipeline and a New Corpus of Named Entities in Late Medieval Texts	May 26, 2023	Information Retrievalnamed-entity-recognition	—Unverified
Persian Handwritten Digit, Character and Word Recognition Using Deep Learning	Oct 24, 2020	Data AugmentationDeep Learning	—Unverified
Pipeline Enabling Zero-shot Classification for Bangla Handwritten Grapheme	Dec 1, 2023	Bangla Text DetectionClassification	—Unverified
Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach	Mar 25, 2022	Optical Character Recognition (OCR)text similarity	—Unverified
Plague Dot Text: Text mining and annotation of outbreak reports of the Third Plague Pandemic (1894-1952)	Feb 4, 2020	EpidemiologyOptical Character Recognition	—Unverified
Platypus: A Generalized Specialist Model for Reading Text in Various Forms	Aug 27, 2024	Handwritten Text RecognitionOptical Character Recognition (OCR)	—Unverified
PLayerTV: Advanced Player Tracking and Identification for Automatic Soccer Highlight Clips	Jul 22, 2024	object-detectionObject Detection	—Unverified
Polar-Doc: One-Stage Document Dewarping with Multi-Scope Constraints under Polar Representation	Dec 13, 2023	Optical Character Recognition (OCR)	—Unverified
PP-DocBee: Improving Multimodal Document Understanding Through a Bag of Tricks	Mar 6, 2025	document understandingLanguage Modeling	—Unverified
PP-OCRv3: More Attempts for the Improvement of Ultra Lightweight OCR System	Jun 7, 2022	Data AugmentationOptical Character Recognition	—Unverified
Preserving Semantic Information from Old Dictionaries: Linking Senses of the `Altfranz\"osisches W\"orterbuch' to WordNet	May 1, 2020	Optical Character Recognition (OCR)	—Unverified
PreSTU: Pre-Training for Scene-Text Understanding	Sep 12, 2022	DecoderImage Captioning	—Unverified
Producing Corpora of Medieval and Premodern Occitan	Apr 26, 2019	LemmatizationOptical Character Recognition	—Unverified
Profiling of OCR'ed Historical Texts Revisited	Jan 19, 2017	Optical Character Recognition (OCR)	—Unverified
Proposal for Automatic License and Number Plate Recognition System for Vehicle Identification	Oct 9, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Proposal Report for the 2nd SciCAP Competition 2024	Jul 2, 2024	Document SummarizationOptical Character Recognition (OCR)	—Unverified
Providing and Analyzing NLP Terms for our Community	Dec 1, 2016	Named Entity Recognition (NER)Optical Character Recognition (OCR)	—Unverified
Pseudo-Bidirectional Decoding for Local Sequence Transduction	Jan 31, 2020	DecoderGrammatical Error Correction	—Unverified
Pynini: A Python library for weighted finite-state grammar compilation	Aug 1, 2016	Automatic Speech Recognition (ASR)Optical Character Recognition (OCR)	—Unverified
Qalam : A Multimodal LLM for Arabic Optical Character and Handwriting Recognition	Jul 18, 2024	DecoderHandwriting Recognition	—Unverified
QID: Efficient Query-Informed ViTs in Data-Scarce Regimes for OCR-free Visual Document Understanding	Apr 3, 2025	document understandingLanguage Modeling	—Unverified
Quantitative Analysis of Image Classification Techniques for Memory-Constrained Devices	May 11, 2020	ClassificationGeneral Classification	—Unverified
RDU: A Region-based Approach to Form-style Document Understanding	Jun 14, 2022	document understandingForm	—Unverified
Reading Ancient Coin Legends: Object Recognition vs. OCR	Apr 26, 2013	ObjectObject Recognition	—Unverified
Reading in the Dark with Foveated Event Vision	Jun 7, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
RealitySummary: Exploring On-Demand Mixed Reality Text Summarization and Question Answering using Large Language Models	May 28, 2024	Document EnhancementMixed Reality	—Unverified

Show:10 25 50

← PrevPage 20 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified