Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1209 papers

Title	Date	Tasks	Status
Neural Monkey: The Current State and Beyond	Mar 1, 2018	Image CaptioningMachine Translation	—Unverified
News Deja Vu: Connecting Past and Present with Semantic Search	Jun 21, 2024	ArticlesOptical Character Recognition (OCR)	—Unverified
N-gram language models for massively parallel devices	Aug 1, 2016	Language ModelingLanguage Modelling	—Unverified
Nonparametric modeling cash flows of insurance company	Aug 14, 2019	Optical Character Recognition (OCR)	—Unverified
NOSE Augment: Fast and Effective Data Augmentation Without Searching	Jan 1, 2021	Data AugmentationDiversity	—Unverified
NoTeS-Bank: Benchmarking Neural Transcription and Search for Scientific Notes Understanding	Apr 12, 2025	BenchmarkingDocument AI	—Unverified
Notes on Applicability of GPT-4 to Document Understanding	May 28, 2024	document understandingOptical Character Recognition (OCR)	—Unverified
NusaAksara: A Multimodal and Multilingual Benchmark for Preserving Indonesian Indigenous Scripts	Feb 25, 2025	Image SegmentationLanguage Identification	—Unverified
NVLM: Open Frontier-Class Multimodal LLMs	Sep 17, 2024	MathMultimodal Reasoning	—Unverified
Object-Centric Representations Improve Policy Generalization in Robot Manipulation	May 16, 2025	Optical Character Recognition (OCR)Robot Manipulation	—Unverified
Object Detection and Recognition of Swap-Bodies using Camera mounted on a Vehicle	Apr 17, 2020	Data Augmentationobject-detection	—Unverified
OCR4all -- An Open-Source Tool Providing a (Semi-)Automatic OCR Workflow for Historical Printings	Sep 9, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR accuracy improvement on document images through a novel pre-processing approach	Sep 11, 2015	BinarizationOptical Character Recognition	—Unverified
OCR and Automated Translation for the Navigation of non-English Handsets: A Feasibility Study with Arabic	Nov 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
OCR and post-correction of historical Finnish texts	May 1, 2017	Optical Character Recognition (OCR)Spelling Correction	—Unverified
OCRAPOSE II: An OCR-based indoor positioning system using mobile phone images	Apr 19, 2017	Depth EstimationOptical Character Recognition	—Unverified
OCR++: A Robust Framework For Information Extraction from Scholarly Articles	Sep 23, 2016	ArticlesOptical Character Recognition (OCR)	—Unverified
OCR, Classification & Machine Translation (OCCAM)	Nov 1, 2020	Classificationimage-classification	—Unverified
OCR Error Correction Using Character Correction and Feature-Based Word Classification	Apr 21, 2016	General ClassificationLanguage Modeling	—Unverified
OCR evaluation tools for the 21st century	Feb 1, 2019	Optical Character Recognition (OCR)	—Unverified
OCR for TIFF Compressed Document Images Directly in Compressed Domain Using Text segmentation and Hidden Markov Model	Sep 13, 2022	Optical Character Recognition (OCR)Text Segmentation	—Unverified
OCR Graph Features for Manipulation Detection in Documents	Sep 10, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR Improves Machine Translation for Low-Resource Languages	Feb 27, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified
OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System	Mar 18, 2024	AllDecision Making	—Unverified
OCR Language Models with Custom Vocabularies	Aug 18, 2023	DecoderLanguage Modeling	—Unverified
OCR of historical printings with an application to building diachronic corpora: A case study using the RIDGES herbal corpus	Aug 6, 2016	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR Post-Correction Evaluation of Early Dutch Books Online - Revisited	May 1, 2016	Optical Character Recognition (OCR)	—Unverified
OCR Post-Processing Text Correction using Simulated Annealing (OPTeCA)	Dec 1, 2017	Feature EngineeringOptical Character Recognition (OCR)	—Unverified
OCR Processing of Swedish Historical Newspapers Using Deep Hybrid CNN–LSTM Networks	Sep 1, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR quality affects perceived usefulness of historical newspaper clippings -- a user study	Mar 4, 2022	ArticlesInformation Retrieval	—Unverified
OCR Quality and NLP Preprocessing	Aug 1, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
OCR-RTPS: An OCR-based real-time positioning system for the valet parking	Dec 8, 2022	Autonomous DrivingOptical Character Recognition (OCR)	—Unverified
OCR Synthetic Benchmark Dataset for Indic Languages	May 5, 2022	Optical Character Recognition (OCR)	—Unverified
OdiEnCorp 2.0: Odia-English Parallel Corpus for Machine Translation	May 1, 2020	Machine TranslationNMT	—Unverified
Offline Handwritten MODI Character Recognition Using HU, Zernike Moments and Zoning	Jun 24, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Old Content and Modern Tools - Searching Named Entities in a Finnish OCRed Historical Newspaper Collection 1771-1910	Nov 9, 2016	named-entity-recognitionNamed Entity Recognition	—Unverified
Omnifont Persian OCR System Using Primitives	Feb 13, 2022	Optical Character Recognition (OCR)	—Unverified
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified
On-Device Language Identification of Text in Images using Diacritic Characters	Nov 10, 2020	Language Identificationobject-detection	—Unverified
On-Device Spatial Attention based Sequence Learning Approach for Scene Text Script Identification	Dec 1, 2021	Optical Character Recognition (OCR)	—Unverified
On-Device Text Image Super Resolution	Nov 20, 2020	Cloud ComputingGPU	—Unverified
One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments	Dec 13, 2024	AllOptical Character Recognition (OCR)	—Unverified
One RL to See Them All: Visual Triple Unified Reinforcement Learning	May 23, 2025	AllMath	—Unverified
Emergency-Brake Simplex: Toward A Verifiably Safe Control-CPS Architecture for Abrupt Runtime Reachability Constraint Changes	Jan 3, 2025	Computational EfficiencyOptical Character Recognition (OCR)	—Unverified
On the Accuracy of CRNNs for Line-Based OCR: A Multi-Parameter Evaluation	Aug 6, 2020	BinarizationData Augmentation	—Unverified
On the feasibility of attacking Thai LPR systems with adversarial examples	Jan 13, 2023	Adversarial AttackLicense Plate Recognition	—Unverified
Open data for Moroccan license plates for OCR applications : data collection, labeling, and model construction	Apr 16, 2021	Data AugmentationLicense Plate Recognition	—Unverified
Open Philology at the University of Leipzig	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
OpenSubtitles2016: Extracting Large Parallel Corpora from Movie and TV Subtitles	May 1, 2016	Optical Character Recognition (OCR)	—Unverified
Open-Vocabulary Scene Text Recognition via Pseudo-Image Labeling and Margin Loss	Mar 12, 2024	Image InpaintingOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 19 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified