Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1209 papers

Title	Date	Tasks	Status
DEVICE: DEpth and VIsual ConcEpts Aware Transformer for TextCaps	Feb 3, 2023	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Noisy Parallel Data Alignment	Jan 23, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
On the feasibility of attacking Thai LPR systems with adversarial examples	Jan 13, 2023	Adversarial AttackLicense Plate Recognition	—Unverified
Improving Inference Performance of Machine Learning with the Divide-and-Conquer Principle	Jan 12, 2023	CPUOptical Character Recognition	—Unverified
Semantic rule Web-based Diagnosis and Treatment of Vector-Borne Diseases using SWRL rules	Jan 8, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Bengali Handwritten Digit Recognition using CNN with Explainable AI	Dec 23, 2022	Explainable Artificial Intelligence (XAI)Handwritten Digit Recognition	—Unverified
Transferring General Multimodal Pretrained Models to Text Recognition	Dec 19, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Wukong-Reader: Multi-modal Pre-training for Fine-grained Visual Document Understanding	Dec 19, 2022	Contrastive Learningdocument understanding	CodeCode Available
Towards Robust Handwritten Text Recognition with On-the-fly User Participation	Dec 17, 2022	Handwritten Text RecognitionOptical Character Recognition (OCR)	—Unverified
SceneGATE: Scene-Graph based co-Attention networks for TExt visual question answering	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Geometric Rectification of Creased Document Images based on Isometric Mapping	Dec 16, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images	Dec 16, 2022	DecoderOptical Character Recognition (OCR)	CodeCode Available
Extending TrOCR for Text Localization-Free OCR of Full-Page Scanned Receipt Images	Dec 11, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
PACMAN: a framework for pulse oximeter digit detection and reading in a low-resource setting	Dec 9, 2022	object-detectionObject Detection	—Unverified
OCR-RTPS: An OCR-based real-time positioning system for the valet parking	Dec 8, 2022	Autonomous DrivingOptical Character Recognition (OCR)	—Unverified
Information Retrieval from the Digitized Books	Dec 2, 2022	Image RetrievalInformation Retrieval	—Unverified
Chart-RCNN: Efficient Line Chart Data Extraction from Camera Images	Nov 25, 2022	object-detectionObject Detection	—Unverified
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified
Out-of-Candidate Rectification for Weakly Supervised Semantic Segmentation	Nov 22, 2022	Optical Character Recognition (OCR)Semantic Segmentation	—Unverified
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ChartParser: Automatic Chart Parsing for Print-Impaired	Nov 16, 2022	Optical Character Recognition (OCR)	—Unverified
Efficient few-shot learning for pixel-precise handwritten document layout analysis	Oct 27, 2022	Document Layout AnalysisFew-Shot Learning	—Unverified
A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail	Oct 26, 2022	CPUOptical Character Recognition	—Unverified
MenuAI: Restaurant Food Recommendation System via a Transformer-based Deep Learning Model	Oct 15, 2022	Food recommendationLearning-To-Rank	—Unverified
Key Information Extraction in Purchase Documents using Deep Learning and Rule-based Corrections	Oct 7, 2022	Key Information ExtractionLine Detection	—Unverified
EraseNet: A Recurrent Residual Network for Supervised Document Cleaning	Oct 3, 2022	DenoisingOptical Character Recognition	—Unverified
Chandojnanam: A Sanskrit Meter Identification and Utilization System	Sep 29, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Synthesizing Annotated Image and Video Data Using a Rendering-Based Pipeline for Improved License Plate Recognition	Sep 28, 2022	Data AugmentationLicense Plate Recognition	—Unverified
3D Rendering Framework for Data Augmentation in Optical Character Recognition	Sep 27, 2022	Data AugmentationOptical Character Recognition	—Unverified
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering	Sep 21, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Out-of-Vocabulary Challenge Report	Sep 14, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Document Image Binarization in JPEG Compressed Domain using Dual Discriminator Generative Adversarial Networks	Sep 13, 2022	BinarizationOptical Character Recognition (OCR)	—Unverified
Computer vision based vehicle tracking as a complementary and scalable approach to RFID tagging	Sep 13, 2022	object-detectionObject Detection	—Unverified
OCR for TIFF Compressed Document Images Directly in Compressed Domain Using Text segmentation and Hidden Markov Model	Sep 13, 2022	Optical Character Recognition (OCR)Text Segmentation	—Unverified
PreSTU: Pre-Training for Scene-Text Understanding	Sep 12, 2022	DecoderImage Captioning	—Unverified
Levenshtein OCR	Sep 8, 2022	Imitation LearningOptical Character Recognition (OCR)	CodeCode Available
Multi-Granularity Prediction for Scene Text Recognition	Sep 8, 2022	Language ModelingLanguage Modelling	CodeCode Available
A Masked Bounding-Box Selection Based ResNet Predictor for Text Rotation Prediction	Sep 6, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
You’ve translated it, now what?	Sep 1, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified
A Black-Box Attack on Optical Character Recognition Systems	Aug 30, 2022	Adversarial AttackBinarization	—Unverified
An Energy Activity Dataset for Smart Homes	Aug 29, 2022	DiversityMiscellaneous	—Unverified
Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages	Aug 26, 2022	DiversityOptical Character Recognition (OCR)	—Unverified
AiM: Taking Answers in Mind to Correct Chinese Cloze Tests in Educational Applications	Aug 26, 2022	Optical Character Recognition (OCR)	CodeCode Available
Visual Subtitle Feature Enhanced Video Outline Generation	Aug 24, 2022	ArticlesHeadline Generation	—Unverified
An End-to-End OCR Framework for Robust Arabic-Handwriting Recognition using a Novel Transformers-based Model and an Innovative 270 Million-Words Multi-Font Corpus of Classical Arabic with Diacritics	Aug 20, 2022	DecoderHandwriting Recognition	—Unverified
To show or not to show: Redacting sensitive text from videos of electronic displays	Aug 19, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Character decomposition to resolve class imbalance problem in Hangul OCR	Aug 12, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Information Extraction from Scanned Invoice Images using Text Analysis and Layout Features	Aug 8, 2022	Optical Character Recognition (OCR)	—Unverified
Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning	Jul 25, 2022	Domain AdaptationOptical Character Recognition (OCR)	—Unverified
DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding	Jul 14, 2022	document understandingOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 13 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified