Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1209 papers

Title	Date	Tasks	Status	Hype
Easter2.0: Improving convolutional models for handwritten text recognition	May 30, 2022	Data AugmentationFew-Shot Learning	CodeCode Available	1
GIT: A Generative Image-to-text Transformer for Vision and Language	May 27, 2022	DecoderImage Captioning	CodeCode Available	2
DisinfoMeme: A Multimodal Dataset for Detecting Meme Intentionally Spreading Out Disinformation	May 25, 2022	Multimodal ReasoningOptical Character Recognition (OCR)	—Unverified	0
LILA-BOTI : Leveraging Isolated Letter Accumulations By Ordering Teacher Insights for Bangla Handwriting Recognition	May 23, 2022	Handwriting RecognitionKnowledge Distillation	CodeCode Available	0
Detection Masking for Improved OCR on Noisy Documents	May 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Towards Deployable OCR models for Indic languages	May 13, 2022	Optical Character Recognition (OCR)Segmentation	—Unverified	0
OCR Synthetic Benchmark Dataset for Indic Languages	May 5, 2022	Optical Character Recognition (OCR)	—Unverified	0
Text Detection on Technical Drawings for the Digitization of Brown-field Processes	May 5, 2022	Data Augmentationobject-detection	—Unverified	0
Explainable Publication Year Prediction of Eighteenth Century Texts with the BERT Model	May 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Hybrid Defense Method against Adversarial Attacks on Traffic Sign Classifiers in Autonomous Vehicles	Apr 25, 2022	Autonomous VehiclesNavigate	—Unverified	0
German Parliamentary Corpus (GerParCor)	Apr 21, 2022	Optical Character Recognition (OCR)	CodeCode Available	1
Unitail: Detecting, Reading, and Matching in Retail Scene	Apr 1, 2022	BenchmarkingDense Object Detection	—Unverified	0
Digitizing Historical Balance Sheet Data: A Practitioner's Guide	Mar 31, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Benchmarking Algorithms for Automatic License Plate Recognition	Mar 27, 2022	BenchmarkingLicense Plate Recognition	—Unverified	0
Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach	Mar 25, 2022	Optical Character Recognition (OCR)text similarity	—Unverified	0
Towards Escaping from Language Bias and OCR Error: Semantics-Centered Text Visual Question Answering	Mar 24, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Document Dewarping with Control Points	Mar 20, 2022	Optical Character Recognition (OCR)	CodeCode Available	1
XYLayoutLM: Towards Layout-Aware Multimodal Networks For Visually-Rich Document Understanding	Mar 14, 2022	document understandingOptical Character Recognition (OCR)	CodeCode Available	1
Language Matters: A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting	Mar 8, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
OCR quality affects perceived usefulness of historical newspaper clippings -- a user study	Mar 4, 2022	ArticlesInformation Retrieval	—Unverified	0
DiT: Self-supervised Pre-training for Document Image Transformer	Mar 4, 2022	Document AIdocument-image-classification	CodeCode Available	1
TableFormer: Table Structure Understanding with Transformers	Mar 2, 2022	Decoderobject-detection	CodeCode Available	1
OCR Improves Machine Translation for Low-Resource Languages	Feb 27, 2022	Machine TranslationOptical Character Recognition (OCR)	—Unverified	0
Improving Amharic Handwritten Word Recognition Using Auxiliary Task	Feb 25, 2022	Handwritten Text RecognitionOptical Character Recognition	—Unverified	0
OCR-IDL: OCR Annotations for Industry Document Library Dataset	Feb 25, 2022	Optical Character Recognition (OCR)	CodeCode Available	1
Semi-Structured Query Grounding for Document-Oriented Databases with Deep Retrieval and Its Application to Receipt and POI Matching	Feb 23, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Identifying OCRs in cfDNA WGS Data by Correlation Clustering	Feb 19, 2022	Clusteringgraph construction	—Unverified	0
BLPnet: A new DNN model and Bengali OCR engine for Automatic License Plate Recognition	Feb 18, 2022	License Plate RecognitionManagement	—Unverified	0
Omnifont Persian OCR System Using Primitives	Feb 13, 2022	Optical Character Recognition (OCR)	—Unverified	0
DocBed: A Multi-Stage OCR Solution for Documents with Complex Layouts	Feb 3, 2022	ArticlesDocument Layout Analysis	—Unverified	0
Self-paced learning to improve text row detection in historical documents with missing labels	Jan 28, 2022	Missing LabelsOptical Character Recognition	—Unverified	0
An Assessment of the Impact of OCR Noise on Language Models	Jan 26, 2022	Language ModellingOptical Character Recognition	—Unverified	0
A Classical Approach to Handcrafted Feature Extraction Techniques for Bangla Handwritten Digit Recognition	Jan 25, 2022	Handwritten Digit RecognitionOptical Character Recognition (OCR)	—Unverified	0
Classroom Slide Narration System	Jan 21, 2022	Image SegmentationOptical Character Recognition	—Unverified	0
Legal Entity Extraction using a Pointer Generator Network	Jan 20, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Improve Sentence Alignment by Divide-and-conquer	Jan 18, 2022	Optical Character Recognition (OCR)Sentence	—Unverified	0
On the Cross-dataset Generalization in License Plate Recognition	Jan 2, 2022	Data AugmentationLicense Plate Detection	CodeCode Available	1
SAFL: A Self-Attention Scene Text Recognizer with Focal Loss	Jan 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Intelligent Document Processing -- Methods and Tools in the real world	Dec 28, 2021	Document ClassificationOptical Character Recognition (OCR)	—Unverified	0
LaTr: Layout-Aware Transformer for Scene-Text VQA	Dec 23, 2021	Optical Character Recognition (OCR)Question Answering	CodeCode Available	1
Challenging America: Modeling language in longer time scales	Dec 17, 2021	Cloze TestOptical Character Recognition (OCR)	—Unverified	0
Lesan -- Machine Translation for Low Resource Languages	Dec 15, 2021	ArticlesMachine Translation	—Unverified	0
Tracing Text Provenance via Context-Aware Lexical Substitution	Dec 15, 2021	Optical Character Recognition (OCR)Sentence	—Unverified	0
Modelling Lips-State Detection Using CNN for Non-Verbal Communications	Dec 9, 2021	License Plate DetectionLicense Plate Recognition	—Unverified	0
A Survey on Deep learning based Document Image Enhancement	Dec 6, 2021	ArticlesBinarization	—Unverified	0
An Automatic Approach for Generating Rich, Linked Geo-Metadata from Historical Map Images	Dec 3, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Transferring Modern Named Entity Recognition to the Historical Domain: How to Take the Step?	Dec 1, 2021	named-entity-recognitionNamed Entity Recognition	—Unverified	0
On-Device Spatial Attention based Sequence Learning Approach for Scene Text Script Identification	Dec 1, 2021	Optical Character Recognition (OCR)	—Unverified	0
OCR-free Document Understanding Transformer	Nov 30, 2021	Document Image Classificationdocument understanding	CodeCode Available	3
Image preprocessing and modified adaptive thresholding for improving OCR	Nov 28, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 13 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified