Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1209 papers

Title	Date	Tasks	Status	Hype
Ice hockey player identification via transformers and weakly supervised learning	Nov 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Discriminative Dictionary Learning based on Statistical Methods	Nov 17, 2021	DenoisingDictionary Learning	—Unverified	0
Indian Licence Plate Dataset in the wild	Nov 11, 2021	object-detectionObject Detection	CodeCode Available	1
Handwritten Digit Recognition Using Improved Bounding Box Recognition Technique	Nov 10, 2021	BIG-bench Machine LearningHandwritten Digit Recognition	—Unverified	0
Lexically Aware Semi-Supervised Learning for OCR Post-Correction	Nov 4, 2021	Language ModellingOptical Character Recognition	CodeCode Available	1
BART for Post-Correction of OCR Newspaper Text	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
Unsupervised Multi-View Post-OCR Error Correction With Language Models	Nov 1, 2021	Domain AdaptationLanguage Modeling	—Unverified	0
SpellBERT: A Lightweight Pretrained Model for Chinese Spelling Check	Nov 1, 2021	Graph Neural NetworkLanguage Modeling	—Unverified	0
Named Entity Recognition in Historic Legal Text: A Transformer and State Machine Ensemble Method	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
DocScanner: Robust Document Image Rectification with Progressive Learning	Oct 28, 2021	Optical Character Recognition (OCR)	CodeCode Available	1
DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction	Oct 25, 2021	Optical Character Recognition (OCR)	CodeCode Available	1
Ultra Light OCR Competition Technical Report	Oct 25, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified	0
Cleaning Dirty Books: Post-OCR Processing for Previously Scanned Texts	Oct 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
HENet: Forcing a Network to Think More for Font Recognition	Oct 21, 2021	Font RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Learning UI Navigation through Demonstrations composed of Macro Actions	Oct 16, 2021	Optical Character Recognition (OCR)	—Unverified	0
Optical Character Recognition of 19th Century Classical Commentaries: the Current State of Affairs	Oct 13, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Robustness Evaluation of Transformer-based Form Field Extractors via Form Attacks	Oct 8, 2021	FormOptical Character Recognition (OCR)	—Unverified	0
WenetSpeech: A 10000+ Hours Multi-domain Mandarin Corpus for Speech Recognition	Oct 7, 2021	Label Error DetectionOptical Character Recognition	CodeCode Available	1
Rerunning OCR: A Machine Learning Approach to Quality Assessment and Enhancement Prediction	Oct 4, 2021	BIG-bench Machine LearningDecision Making	CodeCode Available	1
Asking questions on handwritten document collections	Oct 2, 2021	Optical Character Recognition (OCR)Question Answering	—Unverified	0
A Proposal of Automatic Error Correction in Text	Sep 24, 2021	Information RetrievalLanguage Modelling	—Unverified	0
TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models	Sep 21, 2021	Handwritten Text RecognitionLanguage Modeling	CodeCode Available	1
Deep learning-based NLP Data Pipeline for EHR Scanned Document Information Extraction	Sep 14, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Adapting the Tesseract Open-Source OCR Engine for Tamil and Sinhala Legacy Fonts and Creating a Parallel Corpus for Tamil-Sinhala-English	Sep 13, 2021	Optical Character Recognition (OCR)	CodeCode Available	0
Post-OCR Document Correction with large Ensembles of Character Sequence-to-Sequence Models	Sep 13, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
PP-OCRv2: Bag of Tricks for Ultra Lightweight OCR System	Sep 7, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	2
A Novel Machine Learning Based Approach for Post-OCR Error Detection	Sep 1, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
OCR Processing of Swedish Historical Newspapers Using Deep Hybrid CNN–LSTM Networks	Sep 1, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Multimodal Framework for Video Ads Understanding	Aug 29, 2021	MarketingOptical Character Recognition	—Unverified	0
LayoutReader: Pre-training of Text and Layout for Reading Order Detection	Aug 26, 2021	Document Layout AnalysisOptical Character Recognition (OCR)	—Unverified	0
EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQA	Aug 22, 2021	Open-Ended Question AnsweringOptical Character Recognition (OCR)	—Unverified	0
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified	0
Real-time Bangla License Plate Recognition System for Low Resource Video-based Applications	Aug 18, 2021	License Plate RecognitionOptical Character Recognition (OCR)	—Unverified	0
VisBuddy -- A Smart Wearable Assistant for the Visually Challenged	Aug 17, 2021	Image Captioningobject-detection	—Unverified	0
MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding	Aug 14, 2021	Key Information Extractionnamed-entity-recognition	—Unverified	0
BROS: A Pre-trained Language Model Focusing on Text and Layout for Better Key Information Extraction from Documents	Aug 10, 2021	Key Information ExtractionLanguage Modeling	CodeCode Available	1
Lights, Camera, Action! A Framework to Improve NLP Accuracy over OCR documents	Aug 6, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
The Corpora They Are a-Changing: a Case Study in Italian Newspapers	Aug 1, 2021	Optical Character Recognition (OCR)	—Unverified	0
MinD at SemEval-2021 Task 6: Propaganda Detection using Transfer Learning and Multimodal Fusion	Aug 1, 2021	Optical Character Recognition (OCR)Propaganda detection	—Unverified	0
Robust Learning for Text Classification with Multi-source Noise Simulation and Hard Example Mining	Jul 15, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Scene Text recognition with Full Normalization	Jul 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified	0
Memes in the Wild: Assessing the Generalizability of the Hateful Memes Challenge Dataset	Jul 9, 2021	Optical Character Recognition (OCR)	—Unverified	0
Data Centric Domain Adaptation for Historical Text with OCR Errors	Jul 2, 2021	Cross-Domain Named Entity RecognitionDomain Adaptation	CodeCode Available	0
Automatic Metadata Extraction Incorporating Visual Features from Scanned Electronic Theses and Dissertations	Jul 1, 2021	Key Information ExtractionOptical Character Recognition (OCR)	CodeCode Available	0
SAR-Net: Shape Alignment and Recovery Network for Category-level 6D Object Pose and Size Estimation	Jun 27, 2021	ObjectOptical Character Recognition (OCR)	—Unverified	0
A Simple and Practical Approach to Improve Misspellings in OCR Text	Jun 22, 2021	Optical Character Recognition (OCR)	—Unverified	0
An End-to-End Khmer Optical Character Recognition using Sequence-to-Sequence with Attention	Jun 21, 2021	DecoderOptical Character Recognition	—Unverified	0
Tag, Copy or Predict: A Unified Weakly-Supervised Learning Framework for Visual Information Extraction using Sequences	Jun 20, 2021	DecoderOptical Character Recognition	—Unverified	0
Scene Text Telescope: Text-Focused Scene Image Super-Resolution	Jun 19, 2021	Image Super-ResolutionOptical Character Recognition (OCR)	CodeCode Available	0
Improving OCR-Based Image Captioning by Incorporating Geometrical Relationship	Jun 19, 2021	Image CaptioningOptical Character Recognition (OCR)	—Unverified	0

Show:10 25 50

← PrevPage 14 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified