Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 1209 papers

Title	Date	Tasks	Status
Tablext: A Combined Neural Network And Heuristic Based Table Extractor	Apr 22, 2021	object-detectionObject Detection	—Unverified
Open data for Moroccan license plates for OCR applications : data collection, labeling, and model construction	Apr 16, 2021	Data AugmentationLicense Plate Recognition	—Unverified
TeLCoS: OnDevice Text Localization with Clustering of Script	Apr 16, 2021	ClusteringImage Categorization	—Unverified
PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network	Apr 12, 2021	DecoderOptical Character Recognition (OCR)	CodeCode Available
Document Layout Analysis via Dynamic Residual Feature Fusion	Apr 7, 2021	Document Layout AnalysisOptical Character Recognition	—Unverified
We Live in a Motorized Civilization: Robert Moses Replies to Robert Caro	Mar 26, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ICDAR2019 Competition on Scanned Receipt OCR and Information Extraction	Mar 18, 2021	Key Information ExtractionOptical Character Recognition (OCR)	—Unverified
Interpretable Distance Metric Learning for Handwritten Chinese Character Recognition	Mar 17, 2021	DiversityHandwriting Recognition	—Unverified
uTHCD: A New Benchmarking for Tamil Handwritten OCR	Mar 13, 2021	BenchmarkingOptical Character Recognition (OCR)	—Unverified
Select, Substitute, Search: A New Benchmark for Knowledge-Augmented Visual Question Answering	Mar 9, 2021	Optical Character Recognition (OCR)Question Answering	CodeCode Available
TS-Net: OCR Trained to Switch Between Text Transcription Styles	Mar 9, 2021	Optical Character Recognition (OCR)	—Unverified
Deep Structured Feature Networks for Table Detection and Tabular Data Extraction from Scanned Financial Document Images	Feb 20, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Efficient Online ML API Selection for Multi-Label Classification Tasks	Feb 18, 2021	General Classificationimage-classification	—Unverified
SPAN: a Simple Predict & Align Network for Handwritten Paragraph Recognition	Feb 17, 2021	Handwriting RecognitionHandwritten Text Recognition	CodeCode Available
Post-OCR Paragraph Recognition by Graph Convolutional Networks	Jan 29, 2021	ClusteringOptical Character Recognition (OCR)	—Unverified
It Takes Two to Tango: Combining Visual and Textual Information for Detecting Duplicate Video-Based Bug Reports	Jan 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
An Unsupervised Normalization Algorithm for Noisy Text: A Case Study for Information Retrieval and Stance Detection	Jan 9, 2021	Information RetrievalOptical Character Recognition (OCR)	CodeCode Available
Robust Text CAPTCHAs Using Adversarial Examples	Jan 7, 2021	Adversarial AttackOptical Character Recognition (OCR)	—Unverified
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified
End-to-End Piece-Wise Unwarping of Document Images	Jan 1, 2021	MS-SSIMOptical Character Recognition (OCR)	—Unverified
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified
NOSE Augment: Fast and Effective Data Augmentation Without Searching	Jan 1, 2021	Data AugmentationDiversity	—Unverified
ConvMath: A Convolutional Sequence Network for Mathematical Expression Recognition	Dec 23, 2020	DecoderOptical Character Recognition	—Unverified
Named Entity Recognition in the Legal Domain using a Pointer Generator Network	Dec 17, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Indonesian ID Card Extractor Using Optical Character Recognition and Natural Language Post-Processing	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 32 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified