Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1209 papers

Title	Date	Tasks	Status	Hype
Classification of Documents Extracted from Images with Optical Character Recognition Methods	Jun 15, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified	0
Mixed Model OCR Training on Historical Latin Script for Out-of-the-Box Recognition and Finetuning	Jun 15, 2021	Data AugmentationOptical Character Recognition	—Unverified	0
Implicit Feature Alignment: Learn to Convert Text Recognizer to Text Spotter	Jun 10, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Context-Free TextSpotter for Real-Time and Mobile End-to-End Text Detection and Recognition	Jun 10, 2021	GPUOptical Character Recognition (OCR)	—Unverified	0
Classification of Contract-Amendment Relationships	Jun 8, 2021	ClassificationManagement	—Unverified	0
PAM: Understanding Product Images in Cross Product Category Attribute Extraction	Jun 8, 2021	AttributeAttribute Extraction	—Unverified	0
End-to-End Information Extraction by Character-Level Embedding and Multi-Stage Attentional U-Net	Jun 2, 2021	Optical Character Recognition (OCR)	CodeCode Available	1
Toward Creation of Ancash Lexical Resources from OCR	Jun 1, 2021	Optical Character Recognition (OCR)	—Unverified	0
Bangla Natural Language Processing: A Comprehensive Analysis of Classical, Machine Learning, and Deep Learning Based Methods	May 31, 2021	ArticlesBIG-bench Machine Learning	—Unverified	0
A Full-Stack Search Technique for Domain Optimized Deep Learning Accelerators	May 26, 2021	Optical Character Recognition (OCR)Scheduling	—Unverified	0
Empirical Error Modeling Improves Robustness of Noisy Neural Sequence Labeling	May 25, 2021	Language ModelingLanguage Modelling	CodeCode Available	0
Multi-Type-TD-TSR -- Extracting Tables from Document Images using a Multi-stage Pipeline for Table Detection and Table Structure Recognition: from OCR to Structured Table Representations	May 23, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Simple Transparent Adversarial Examples	May 20, 2021	Image Generationobject-detection	—Unverified	0
End-to-End Unsupervised Document Image Blind Denoising	May 19, 2021	DenoisingImage Denoising	—Unverified	0
STRIDE : Scene Text Recognition In-Device	May 17, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Unknown-box Approximation to Improve Optical Character Recognition Performance	May 17, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Reciprocal Feature Learning via Explicit and Implicit Tasks in Scene Text Recognition	May 13, 2021	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified	0
Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active Learning	May 12, 2021	Active LearningOptical Character Recognition	—Unverified	0
TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text	May 12, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
GroupLink: An End-to-end Multitask Method for Word Grouping and Relation Extraction in Form Understanding	May 10, 2021	FormOptical Character Recognition (OCR)	—Unverified	0
An end-to-end Optical Character Recognition approach for ultra-low-resolution printed text images	May 10, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
End-to-End Optical Character Recognition for Bengali Handwritten Words	May 9, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Word-Level Alignment of Paper Documents with their Electronic Full-Text Counterparts	Apr 30, 2021	Optical Character Recognition (OCR)	CodeCode Available	0
AT-ST: Self-Training Adaptation Strategy for OCR in Domains with Limited Transcriptions	Apr 27, 2021	Optical Character Recognition (OCR)	CodeCode Available	1
Analyzing Green View Index and Green View Index best path using Google Street View and deep learning	Apr 26, 2021	Optical Character Recognition (OCR)Semantic Segmentation	CodeCode Available	0
Tablext: A Combined Neural Network And Heuristic Based Table Extractor	Apr 22, 2021	object-detectionObject Detection	—Unverified	0
Operationalizing a National Digital Library: The Case for a Norwegian Transformer Model	Apr 19, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
TeLCoS: OnDevice Text Localization with Clustering of Script	Apr 16, 2021	ClusteringImage Categorization	—Unverified	0
Open data for Moroccan license plates for OCR applications : data collection, labeling, and model construction	Apr 16, 2021	Data AugmentationLicense Plate Recognition	—Unverified	0
Samanantar: The Largest Publicly Available Parallel Corpora Collection for 11 Indic Languages	Apr 12, 2021	Machine TranslationMultilingual NLP	CodeCode Available	1
PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network	Apr 12, 2021	DecoderOptical Character Recognition (OCR)	CodeCode Available	0
Video-aided Unsupervised Grammar Induction	Apr 9, 2021	Optical Character Recognition (OCR)	CodeCode Available	1
Document Layout Analysis via Dynamic Residual Feature Fusion	Apr 7, 2021	Document Layout AnalysisOptical Character Recognition	—Unverified	0
A Multiplexed Network for End-to-End, Multilingual OCR	Mar 29, 2021	Optical Character Recognition (OCR)Text Detection	CodeCode Available	1
We Live in a Motorized Civilization: Robert Moses Replies to Robert Caro	Mar 26, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
ICDAR2019 Competition on Scanned Receipt OCR and Information Extraction	Mar 18, 2021	Key Information ExtractionOptical Character Recognition (OCR)	—Unverified	0
Interpretable Distance Metric Learning for Handwritten Chinese Character Recognition	Mar 17, 2021	DiversityHandwriting Recognition	—Unverified	0
Combining Morphological and Histogram based Text Line Segmentation in the OCR Context	Mar 16, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Generating Synthetic Handwritten Historical Documents With OCR Constrained GANs	Mar 15, 2021	Optical Character Recognition (OCR)Synthetic Data Generation	CodeCode Available	1
uTHCD: A New Benchmarking for Tamil Handwritten OCR	Mar 13, 2021	BenchmarkingOptical Character Recognition (OCR)	—Unverified	0
TS-Net: OCR Trained to Switch Between Text Transcription Styles	Mar 9, 2021	Optical Character Recognition (OCR)	—Unverified	0
Select, Substitute, Search: A New Benchmark for Knowledge-Augmented Visual Question Answering	Mar 9, 2021	Optical Character Recognition (OCR)Question Answering	CodeCode Available	0
Deep Structured Feature Networks for Table Detection and Tabular Data Extraction from Scanned Financial Document Images	Feb 20, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Efficient Online ML API Selection for Multi-Label Classification Tasks	Feb 18, 2021	General Classificationimage-classification	—Unverified	0
SPAN: a Simple Predict & Align Network for Handwritten Paragraph Recognition	Feb 17, 2021	Handwriting RecognitionHandwritten Text Recognition	CodeCode Available	0
Neural OCR Post-Hoc Correction of Historical Corpora	Feb 1, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Post-OCR Paragraph Recognition by Graph Convolutional Networks	Jan 29, 2021	ClusteringOptical Character Recognition (OCR)	—Unverified	0
Exploring Cross-Image Pixel Contrast for Semantic Segmentation	Jan 28, 2021	Metric LearningOptical Character Recognition (OCR)	CodeCode Available	1
It Takes Two to Tango: Combining Visual and Textual Information for Detecting Duplicate Video-Based Bug Reports	Jan 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
An Unsupervised Normalization Algorithm for Noisy Text: A Case Study for Information Retrieval and Stance Detection	Jan 9, 2021	Information RetrievalOptical Character Recognition (OCR)	CodeCode Available	0

Show:10 25 50

← PrevPage 15 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified