Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1209 papers

Title	Date	Tasks	Status
Augmented Math: Authoring AR-Based Explorable Explanations by Augmenting Static Math Textbooks	Jul 30, 2023	MathOptical Character Recognition	CodeCode Available
Optimizing the Neural Network Training for OCR Error Correction of Historical Hebrew Texts	Jul 30, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition	Jul 25, 2023	Language ModellingOptical Character Recognition (OCR)	—Unverified
MataDoc: Margin and Text Aware Document Dewarping for Arbitrary Boundary	Jul 24, 2023	document understandingOptical Character Recognition (OCR)	—Unverified
A comparative analysis of SRGAN models	Jul 18, 2023	Generative Adversarial NetworkImage Super-Resolution	—Unverified
Handwritten and Printed Text Segmentation: A Signature Case Study	Jul 15, 2023	Binary ClassificationOptical Character Recognition	—Unverified
Handwritten Text Recognition Using Convolutional Neural Network	Jul 11, 2023	Handwritten Text RecognitionOptical Character Recognition	—Unverified
A Novel Pipeline for Improving Optical Character Recognition through Post-processing Using Natural Language Processing	Jul 9, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Artificial Eye for the Blind	Jul 7, 2023	Objectobject-detection	—Unverified
mPLUG-DocOwl: Modularized Multimodal Large Language Model for Document Understanding	Jul 4, 2023	document understandingLanguage Modeling	—Unverified
Estimating Post-OCR Denoising Complexity on Numerical Texts	Jul 3, 2023	DenoisingOptical Character Recognition (OCR)	—Unverified
Fraunhofer SIT at CheckThat! 2023: Mixing Single-Modal Classifiers to Estimate the Check-Worthiness of Multi-Modal Tweets	Jul 2, 2023	Fact CheckingOptical Character Recognition (OCR)	—Unverified
Resume Information Extraction via Post-OCR Text Processing	Jun 23, 2023	Object RecognitionOptical Character Recognition	—Unverified
A Survey on Multimodal Large Language Models	Jun 23, 2023	HallucinationIn-Context Learning	—Unverified
Document Image Cleaning using Budget-Aware Black-Box Approximation	Jun 22, 2023	Optical Character Recognition (OCR)	CodeCode Available
When Vision Fails: Text Attacks Against ViT and OCR	Jun 12, 2023	Optical Character Recognition (OCR)	CodeCode Available
Weakly supervised information extraction from inscrutable handwritten document images	Jun 12, 2023	Language ModelingLanguage Modelling	—Unverified
SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning	Jun 6, 2023	Caption GenerationImage Captioning	CodeCode Available
Transformer-Based UNet with Multi-Headed Cross-Attention Skip Connections to Eliminate Artifacts in Scanned Documents	Jun 5, 2023	DenoisingDocument Classification	—Unverified
Improving Handwritten OCR with Training Samples Generated by Glyph Conditional Denoising Diffusion Probabilistic Model	May 31, 2023	DenoisingOptical Character Recognition (OCR)	—Unverified
DuoSearch: A Novel Search Engine for Bulgarian Historical Documents	May 30, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
A template-independent approach for information extraction in real estate documents	May 30, 2023	Information RetrievalNatural Language Understanding	CodeCode Available
People and Places of Historical Europe: Bootstrapping Annotation Pipeline and a New Corpus of Named Entities in Late Medieval Texts	May 26, 2023	Information Retrievalnamed-entity-recognition	—Unverified
Quantifying Character Similarity with Vision Transformers	May 24, 2023	Optical Character Recognition (OCR)	CodeCode Available
DUBLIN -- Document Understanding By Language-Image Network	May 23, 2023	Document Classificationdocument understanding	—Unverified
Measuring Intersectional Biases in Historical Documents	May 21, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
TextDiffuser: Diffusion Models as Text Painters	May 18, 2023	Optical Character Recognition (OCR)	—Unverified
Mobile User Interface Element Detection Via Adaptively Prompt Tuning	May 16, 2023	object-detectionObject Detection	CodeCode Available
Sequence-to-Sequence Pre-training with Unified Modality Masking for Visual Document Understanding	May 16, 2023	Decoderdocument understanding	—Unverified
Combining OCR Models for Reading Early Modern Printed Books	May 11, 2023	Font RecognitionOptical Character Recognition (OCR)	CodeCode Available
E2TIMT: Efficient and Effective Modal Adapter for Text Image Machine Translation	May 9, 2023	DecoderMachine Translation	CodeCode Available
Text Reading Order in Uncontrolled Conditions by Sparse Graph Segmentation	May 4, 2023	Optical Character Recognition (OCR)	—Unverified
Evaluating BERT-based Scientific Relation Classifiers for Scholarly Knowledge Graph Construction on Digital Library Collections	May 3, 2023	graph constructionOptical Character Recognition	—Unverified
ICDAR 2023 Competition on Reading the Seal Title	Apr 24, 2023	Optical Character Recognition (OCR)Task 2	—Unverified
Multimodal Short Video Rumor Detection System Based on Contrastive Learning	Apr 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TransDocs: Optical Character Recognition with word to word translation	Apr 15, 2023	Deep LearningDocument Translation	CodeCode Available
Cleansing Jewel: A Neural Spelling Correction Model Built On Google OCR-ed Tibetan Manuscripts	Apr 7, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Linking Representations with Multimodal Contrastive Learning	Apr 7, 2023	Contrastive LearningOptical Character Recognition	—Unverified
A semi-automatic method for document classification in the shipping industry	Mar 29, 2023	ClassificationDocument Classification	—Unverified
OVeNet: Offset Vector Network for Semantic Segmentation	Mar 25, 2023	Optical Character Recognition (OCR)Scene Understanding	CodeCode Available
CLIP-ReIdent: Contrastive Training for Player Re-Identification	Mar 21, 2023	Optical Character Recognition (OCR)Sports Analytics	—Unverified
Optical Character Recognition and Transcription of Berber Signs from Images in a Low-Resource Language Amazigh	Mar 21, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
The System Description of dun_oscar team for The ICPR MSR Challenge	Mar 13, 2023	Optical Character Recognition (OCR)	—Unverified
BaDLAD: A Large Multi-Domain Bengali Document Layout Analysis Dataset	Mar 9, 2023	BenchmarkingDeep Learning	CodeCode Available
Meme Sentiment Analysis Enhanced with Multimodal Spatial Encoding and Facial Embedding	Mar 3, 2023	Optical Character Recognition (OCR)Position	—Unverified
StrucTexTv2: Masked Visual-Textual Prediction for Document Image Pre-training	Mar 1, 2023	Document Image Classificationimage-classification	CodeCode Available
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
User-Centric Evaluation of OCR Systems for Kwak'wala	Feb 26, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
An Investigation into Pre-Training Object-Centric Representations for Reinforcement Learning	Feb 9, 2023	ObjectOptical Character Recognition (OCR)	—Unverified
SPARLING: Learning Latent Representations with Extremely Sparse Activations	Feb 3, 2023	Optical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 12 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified