Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 1209 papers

Title	Date	Tasks	Status
EfficientOCR: An Extensible, Open-Source Package for Efficiently Digitizing World Knowledge	Oct 16, 2023	Image RetrievalLanguage Modeling	—Unverified
Bypassing Captcha By Machine A Proof For Passing The Turing Test	Sep 3, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
BusiNet -- a Light and Fast Text Detection Network for Business Documents	Jul 4, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Novel Transfer Learning Approach upon Hindi, Arabic, and Bangla Numerals using Convolutional Neural Networks	Jul 26, 2017	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
A Novel Pipeline for Improving Optical Character Recognition through Post-processing Using Natural Language Processing	Jul 9, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Novel Method for the Recognition of Isolated Handwritten Arabic Characters	Feb 26, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Building A Handwritten Cuneiform Character Imageset	May 1, 2018	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Building a Corpus from Handwritten Picture Postcards: Transcription, Annotation and Part-of-Speech Tagging	May 1, 2018	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
Efficient Medical VIE via Reinforcement Learning	Jun 16, 2025	DiversityOptical Character Recognition (OCR)	—Unverified
Embedding Similarity Guided License Plate Super Resolution	Jan 2, 2025	License Plate RecognitionOptical Character Recognition	—Unverified
Budget-Optimal Task Allocation for Reliable Crowdsourcing Systems	Oct 17, 2011	image-classificationImage Classification	—Unverified
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified
A Novel Machine Learning Based Approach for Post-OCR Error Detection	Sep 1, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Broken News: Making Newspapers Accessible to Print-Impaired	Jun 21, 2022	Instance SegmentationOptical Character Recognition (OCR)	—Unverified
A Novel Approach to Skew-Detection and Correction of English Alphabets for OCR	Jan 2, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Holistic Approach for Optimizing DSP Block Utilization of a CNN implementation on FPGA	Mar 21, 2017	Optical Character Recognition (OCR)	—Unverified
A Novel Approach to OCR using Image Recognition based Classification for Ancient Tamil Inscriptions in Temples	Jul 4, 2019	BinarizationGeneral Classification	—Unverified
Braille-to-Speech Generator: Audio Generation Based on Joint Fine-Tuning of CLIP and Fastspeech2	Jul 19, 2024	Audio GenerationAudio Synthesis	—Unverified
A Conglomerate of Multiple OCR Table Detection and Extraction	Oct 16, 2020	Optical Character Recognition (OCR)Table Detection	—Unverified
BoundingDocs: a Unified Dataset for Document Question Answering with Spatial Annotations	Jan 6, 2025	Document AIdocument understanding	—Unverified
Bootstrapping a historical commodities lexicon with SKOS and DBpedia	Apr 1, 2014	ChunkingLanguage Identification	—Unverified
3D Rendering Framework for Data Augmentation in Optical Character Recognition	Sep 27, 2022	Data AugmentationOptical Character Recognition	—Unverified
Efficient Media Retrieval from Non-Cooperative Queries	Nov 19, 2014	Optical Character Recognition (OCR)Retrieval	—Unverified
Endangered Data for Endangered Languages: Digitizing Print dictionaries	Mar 1, 2017	Optical Character Recognition (OCR)	—Unverified
From Training-Free to Adaptive: Empirical Insights into MLLMs' Understanding of Detection Information	Jan 31, 2024	Hallucinationobject-detection	—Unverified
Exploiter des mod\`eles de langue pour \'evaluer des sorties de logiciels d'OCR pour des documents fran du XVIIe si\`ecle ()	Jun 1, 2020	Optical Character Recognition (OCR)	—Unverified
Boosting Optical Character Recognition: A Super-Resolution Approach	Jun 7, 2015	Image Super-ResolutionOptical Character Recognition	—Unverified
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified
An Offline Technique for Localization of License Plates for Indian Commercial Vehicles	Mar 4, 2010	License Plate RecognitionOptical Character Recognition	—Unverified
Books of Hours. the First Liturgical Data Set for Text Segmentation.	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified
Modelling Lips-State Detection Using CNN for Non-Verbal Communications	Dec 9, 2021	License Plate DetectionLicense Plate Recognition	—Unverified
A Generic Method for Automatic Ground Truth Generation of Camera-captured Documents	May 4, 2016	ArticlesOptical Character Recognition (OCR)	—Unverified
A Comparative Study of Filtering Approaches Applied to Color Archival Document Images	Aug 16, 2019	DenoisingImage Enhancement	—Unverified
BLPnet: A new DNN model and Bengali OCR engine for Automatic License Plate Recognition	Feb 18, 2022	License Plate RecognitionManagement	—Unverified
An Investigation into Pre-Training Object-Centric Representations for Reinforcement Learning	Feb 9, 2023	ObjectOptical Character Recognition (OCR)	—Unverified
BIOfid Dataset: Publishing a German Gold Standard for Named Entity Recognition in Historical Biodiversity Literature	Nov 1, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified
A New Approach for Texture based Script Identification At Block Level using Quad Tree Decomposition	Sep 16, 2020	Optical Character Recognition (OCR)Tree Decomposition	—Unverified
A Compositional Textual Model for Recognition of Imperfect Word Images	Nov 27, 2018	Optical Character Recognition (OCR)Printed Text Recognition	—Unverified
Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages	Aug 26, 2022	DiversityOptical Character Recognition (OCR)	—Unverified
Effective search space reduction for spell correction using character neural embeddings	Apr 1, 2017	Optical Character Recognition (OCR)	—Unverified
Bidirectional Trained Tree-Structured Decoder for Handwritten Mathematical Expression Recognition	Dec 31, 2023	DecoderLanguage Modeling	—Unverified
A free and open-source tool that reads movie subtitles aloud	Jun 1, 2012	Optical Character Recognition (OCR)	—Unverified
Beyond the Mud: Datasets and Benchmarks for Computer Vision in Off-Road Racing	Feb 12, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs	Nov 28, 2024	AttributeHallucination	—Unverified
A Full-Stack Search Technique for Domain Optimized Deep Learning Accelerators	May 26, 2021	Optical Character Recognition (OCR)Scheduling	—Unverified
EASTER: Efficient and Scalable Text Recognizer	Aug 18, 2020	BenchmarkingHandwritten Text Recognition	—Unverified
Between History and Natural Language Processing: Study, Enrichment and Online Publication of French Parliamentary Debates of the Early Third Republic (1881-1899)	Jun 1, 2022	Optical Character Recognition (OCR)	—Unverified
BennettNLP at SemEval-2020 Task 8: Multimodal sentiment classification Using Hybrid Hierarchical Classifier	Dec 1, 2020	Multimodal Sentiment AnalysisOptical Character Recognition (OCR)	—Unverified
Bengali Handwritten Digit Recognition using CNN with Explainable AI	Dec 23, 2022	Explainable Artificial Intelligence (XAI)Handwritten Digit Recognition	—Unverified

Show:10 25 50

← PrevPage 7 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified