Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1209 papers

Title	Date	Tasks	Status
Analyzing Patterns and Influence of Advertising in Print Newspapers	May 16, 2025	ArticlesOptical Character Recognition (OCR)	—Unverified
Learning Multiple Tasks in Parallel with a Shared Annotator	Dec 1, 2014	Binary ClassificationDocument Classification	—Unverified
Corpus of 19th-century Czech Texts: Problems and Solutions	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Abstractive Information Extraction from Scanned Invoices (AIESI) using End-to-end Sequential Approach	Sep 12, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Learning Ensembles of Structured Prediction Rules	Jun 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Learning UI Navigation through Demonstrations composed of Macro Actions	Oct 16, 2021	Optical Character Recognition (OCR)	—Unverified
Towards Self-Improvement of Diffusion Models via Group Preference Optimization	May 16, 2025	Optical Character Recognition (OCR)	—Unverified
Attacking Optical Character Recognition (OCR) Systems with Adversarial Watermarks	Feb 8, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
LayoutReader: Pre-training of Text and Layout for Reading Order Detection	Aug 26, 2021	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified
CorA: A web-based annotation tool for historical and other non-standard language data	Apr 1, 2014	Optical Character Recognition (OCR)	—Unverified
Improving Optical Character Recognition of Finnish Historical Newspapers with a Combination of Fraktur \& Antiqua Models and Image Preprocessing	May 1, 2017	Boundary DetectionInformation Retrieval	—Unverified
Advanced ingestion process powered by LLM parsing for RAG system	Dec 16, 2024	Optical Character Recognition (OCR)RAG	—Unverified
Learning Adaptive Value of Information for Structured Prediction	Dec 1, 2013	feature selectionModel Selection	—Unverified
Legal Entity Extraction using a Pointer Generator Network	Jan 20, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Leveraging Text Repetitions and Denoising Autoencoders in OCR Post-correction	Jun 26, 2019	DenoisingOptical Character Recognition (OCR)	—Unverified
Lipi Gnani - A Versatile OCR for Documents in any Language Printed in Kannada Script	Jan 2, 2019	BinarizationOptical Character Recognition (OCR)	—Unverified
Improving OCR Quality in 19th Century Historical Documents Using a Combined Machine Learning Based Approach	Jan 15, 2024	Optical Character Recognition (OCR)	—Unverified
Improving OCR-Based Image Captioning by Incorporating Geometrical Relationship	Jun 19, 2021	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Convolutional Neural Networks for Font Classification	Aug 11, 2017	ClassificationData Augmentation	—Unverified
A document processing pipeline for the construction of a dataset for topic modeling based on the judgments of the Italian Supreme Court	May 13, 2025	DiversityDocument Layout Analysis	—Unverified
Convolutional Neural Networks for Automatic Meter Reading	Feb 25, 2019	Counter RecognitionData Augmentation	—Unverified
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
Language Matters: A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting	Mar 8, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ConvMath: A Convolutional Sequence Network for Mathematical Expression Recognition	Dec 23, 2020	DecoderOptical Character Recognition	—Unverified
Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory	Nov 5, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
An accurate and revised version of optical character recognition-based speech synthesis using LabVIEW	Jun 18, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Improving Text Generation on Images with Synthetic Captions	Jun 1, 2024	Optical Character Recognition (OCR)Text Generation	—Unverified
IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Text Detection	May 3, 2018	Multi-Oriented Scene Text Detectionobject-detection	—Unverified
Improving Inference Performance of Machine Learning with the Divide-and-Conquer Principle	Jan 12, 2023	CPUOptical Character Recognition	—Unverified
Indigenous language technologies in Canada: Assessment, challenges, and successes	Aug 1, 2018	Machine TranslationOptical Character Recognition	—Unverified
Corporate IT-support Help-Desk Process Hybrid-Automation Solution with Machine Learning Approach	Sep 18, 2019	BIG-bench Machine LearningOptical Character Recognition (OCR)	—Unverified
Indonesian ID Card Extractor Using Optical Character Recognition and Natural Language Post-Processing	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Improving Handwritten OCR with Training Samples Generated by Glyph Conditional Denoising Diffusion Probabilistic Model	May 31, 2023	DenoisingOptical Character Recognition (OCR)	—Unverified
Information Extraction from Scanned Invoice Images using Text Analysis and Layout Features	Aug 8, 2022	Optical Character Recognition (OCR)	—Unverified
Information Extraction from Unstructured data using Augmented-AI and Computer Vision	Dec 15, 2023	Optical Character Recognition (OCR)	—Unverified
Information Retrieval from the Digitized Books	Dec 2, 2022	Image RetrievalInformation Retrieval	—Unverified
Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods	May 1, 2018	ArticlesGrammatical Error Correction	—Unverified
Integrating Optical Character Recognition and Machine Translation of Historical Documents	Dec 1, 2016	Language ModelingLanguage Modelling	—Unverified
Integration of Text-maps in Convolutional Neural Networks for Region Detection among Different Textual Categories	May 26, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Intelligent Automation for FDI Facilitation: Optimizing Tariff Exemption Processes with OCR And Large Language Models	Jun 12, 2025	Large Language ModelOptical Character Recognition	—Unverified
Contrastive Graph Multimodal Model for Text Classification in Videos	Jun 6, 2022	ClassificationContrastive Learning	—Unverified
1 Million Captioned Dutch Newspaper Images	May 1, 2016	ArticlesData-to-Text Generation	—Unverified
Large Language Models for Page Stream Segmentation	Aug 21, 2024	DecoderOptical Character Recognition	—Unverified
Improving Document Clustering by Removing Unnatural Language	Sep 1, 2017	ClusteringDocument Layout Analysis	—Unverified
Improving Amharic Handwritten Word Recognition Using Auxiliary Task	Feb 25, 2022	Handwritten Text RecognitionOptical Character Recognition	—Unverified
Introducing the Reference Corpus of Contemporary Portuguese Online	May 1, 2012	Optical Character Recognition (OCR)	—Unverified
Investigating the Decoders of Maximum Likelihood Sequence Models: A Look-ahead Approach	Mar 8, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
Invisible Threats: Backdoor Attack in OCR Systems	Oct 12, 2023	Backdoor AttackOptical Character Recognition	—Unverified
Context-Independent OCR with Multimodal LLMs: Effects of Image Resolution and Visual Complexity	Mar 31, 2025	Image CaptioningOptical Character Recognition	—Unverified
Improve Sentence Alignment by Divide-and-conquer	Jan 18, 2022	Optical Character Recognition (OCR)Sentence	—Unverified

Show:10 25 50

← PrevPage 12 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified