Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 1209 papers

Title	Date	Tasks	Status	Hype
SuperOCR: A Conversion from Optical Character Recognition to Image Captioning	Nov 21, 2020	Image CaptioningLicense Plate Recognition	—Unverified	0
On-Device Text Image Super Resolution	Nov 20, 2020	Cloud ComputingGPU	—Unverified	0
Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts	Nov 18, 2020	Clusteringnamed-entity-recognition	—Unverified	0
On-Device Language Identification of Text in Images using Diacritic Characters	Nov 10, 2020	Language Identificationobject-detection	—Unverified	0
OCR Post Correction for Endangered Language Texts	Nov 10, 2020	Optical Character Recognition (OCR)	CodeCode Available	1
Automated data extraction of bar chart raster images	Nov 9, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
An Unsupervised method for OCR Post-Correction and Spelling Normalisation for Finnish	Nov 6, 2020	Machine TranslationNMT	CodeCode Available	1
Handwriting Classification for the Analysis of Art-Historical Documents	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available	0
Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive	Nov 2, 2020	HTROptical Character Recognition (OCR)	—Unverified	0
OCR, Classification & Machine Translation (OCCAM)	Nov 1, 2020	Classificationimage-classification	—Unverified	0
Chunk-based Chinese Spelling Check with Global Optimization	Nov 1, 2020	global-optimizationOptical Character Recognition	—Unverified	0
Alleviating Digitization Errors in Named Entity Recognition for Historical Documents	Nov 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	0
RUArt: A Novel Text-Centered Solution for Text-Based Visual Question Answering	Oct 24, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Persian Handwritten Digit, Character and Word Recognition Using Deep Learning	Oct 24, 2020	Data AugmentationDeep Learning	—Unverified	0
TLGAN: document Text Localization using Generative Adversarial Nets	Oct 22, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified	0
DE-GAN: A Conditional Generative Adversarial Network for Document Enhancement	Oct 17, 2020	BinarizationDeblurring	CodeCode Available	1
A Conglomerate of Multiple OCR Table Detection and Extraction	Oct 16, 2020	Optical Character Recognition (OCR)Table Detection	—Unverified	0
DocStruct: A Multimodal Method to Extract Hierarchy Structure in Document for General Form Understanding	Oct 15, 2020	FormOptical Character Recognition (OCR)	—Unverified	0
Tokenization Repair in the Presence of Spelling Errors	Oct 15, 2020	Optical Character Recognition (OCR)Spelling Correction	CodeCode Available	1
Table Structure Recognition using Top-Down and Bottom-Up Cues	Oct 9, 2020	Cell DetectionOptical Character Recognition	CodeCode Available	1
Finding the Evidence: Localization-aware Answer Prediction for Text Visual Question Answering	Oct 6, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
A Large Multi-Target Dataset of Common Bengali Handwritten Graphemes	Oct 1, 2020	Multi-Label ClassificationOptical Character Recognition	CodeCode Available	1
Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition	Sep 23, 2020	DecoderOptical Character Recognition (OCR)	—Unverified	0
Towards Image-based Automatic Meter Reading in Unconstrained Scenarios: A Robust and Efficient Approach	Sep 21, 2020	Image-based Automatic Meter ReadingMeter Reading	—Unverified	0

Show:10 25 50

← PrevPage 32 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified