Scene Text Recognition

See Scene Text Detection for leaderboards in this task.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 269 papers

Title	Date	Tasks	Status
Benchmarking Scene Text Recognition in Devanagari, Telugu and Malayalam	Apr 9, 2021	BenchmarkingScene Text Recognition	—Unverified
Billet Number Recognition Based on Test-Time Adaptation	Feb 13, 2025	Scene Text RecognitionTest-time Adaptation	—Unverified
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified
Char-Net: A Character-Aware Neural Network for Distorted Scene Text Recognition	Apr 27, 2018	DecoderScene Text Recognition	—Unverified
Choose What You Need: Disentangled Representation Learning for Scene Text Recognition, Removal and Editing	May 7, 2024	DecoderRepresentation Learning	—Unverified
Choose What You Need: Disentangled Representation Learning for Scene Text Recognition Removal and Editing	Jan 1, 2024	DecoderRepresentation Learning	—Unverified
CLIPTER: Looking at the Bigger Picture in Scene Text Recognition	Jan 18, 2023	Language ModelingLanguage Modelling	—Unverified
CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition	Jan 18, 2024	PositionScene Text Recognition	—Unverified
Context-Aware Selective Label Smoothing for Calibrating Sequence Recognition Model	Mar 13, 2023	Decision MakingScene Text Recognition	—Unverified
Context Perception Parallel Decoder for Scene Text Recognition	Jul 23, 2023	DecoderLanguage Modelling	—Unverified
Revisiting Classification Perspective on Scene Text Recognition	Feb 22, 2021	ClassificationGeneral Classification	—Unverified
Cursive Scene Text Analysis by Deep Convolutional Linear Pyramids	Sep 27, 2018	object-detectionObject Detection	—Unverified
Decoder Pre-Training with only Text for Scene Text Recognition	Aug 11, 2024	DecoderScene Text Recognition	—Unverified
Decoupling Visual-Semantic Feature Learning for Robust Scene Text Recognition	Nov 24, 2021	DecoderScene Text Recognition	—Unverified
Deep Learning based Isolated Arabic Scene Character Recognition	Apr 22, 2017	Deep LearningScene Text Recognition	—Unverified
Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition	Mar 7, 2023	Image ReconstructionScene Text Recognition	—Unverified
DiffusionSTR: Diffusion Model for Scene Text Recognition	Jun 29, 2023	Image to textmodel	—Unverified
Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer	Apr 19, 2024	DecoderOptical Character Recognition	—Unverified
DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond	Oct 19, 2023	Document AIDocument Layout Analysis	—Unverified
Double Supervised Network with Attention Mechanism for Scene Text Recognition	Aug 2, 2018	Scene Text Recognition	—Unverified
Edit Probability for Scene Text Recognition	May 9, 2018	DecoderScene Text Recognition	—Unverified
Efficient and Accurate Scene Text Recognition with Cascaded-Transformers	Mar 24, 2025	DecoderScene Text Recognition	—Unverified
Efficiently Leveraging Linguistic Priors for Scene Text Spotting	Feb 27, 2024	Scene Text RecognitionText Detection	—Unverified
Enhancing Energy Minimization Framework for Scene Text Recognition with Top-Down Cues	Jan 13, 2016	Scene Text Recognition	—Unverified
ESIR: End-to-end Scene Text Recognition via Iterative Image Rectification	Dec 14, 2018	Scene Text Recognition	—Unverified
Exploiting Local Structures with the Kronecker Layer in Convolutional Networks	Dec 31, 2015	Scene Text Recognition	—Unverified
Exploring Font-independent Features for Scene Text Recognition	Sep 16, 2020	Image-to-Image TranslationScene Text Recognition	—Unverified
FedOCR: Communication-Efficient Federated Learning for Scene Text Recognition	Jul 22, 2020	Federated LearningPrivacy Preserving	—Unverified
FEDS -- Filtered Edit Distance Surrogate	Mar 8, 2021	Scene Text Recognition	—Unverified
Focusing Attention: Towards Accurate Text Recognition in Natural Images	Sep 7, 2017	DecoderScene Text Recognition	—Unverified
Efficient Online ML API Selection for Multi-Label Classification Tasks	Feb 18, 2021	General Classificationimage-classification	—Unverified
Generative Shape Models: Joint Text Recognition and Segmentation with Very Little Training Data	Nov 9, 2016	Instance SegmentationScene Text Recognition	—Unverified
GTC: Guided Training of CTC Towards Efficient and Accurate Scene Text Recognition	Feb 4, 2020	DecoderScene Text Recognition	—Unverified
HAAP: Vision-context Hierarchical Attention Autoregressive with Adaptive Permutation for Scene Text Recognition	May 15, 2024	DiversityLanguage Modeling	—Unverified
Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition	Sep 23, 2020	DecoderOptical Character Recognition (OCR)	—Unverified
I2C2W: Image-to-Character-to-Word Transformers for Accurate Scene Text Recognition	May 18, 2021	DecoderScene Text Recognition	—Unverified
IFR: Iterative Fusion Based Recognizer For Low Quality Scene Text Recognition	Aug 13, 2021	Image RestorationScene Text Recognition	—Unverified
Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory	Nov 5, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Improving Scene Text Recognition for Character-Level Long-Tailed Distribution	Mar 31, 2023	Scene Text Recognition	—Unverified
IndicSTR12: A Dataset for Indic Scene Text Recognition	Mar 12, 2024	BenchmarkingScene Text Recognition	—Unverified
Instruction-Guided Scene Text Recognition	Jan 31, 2024	Question AnsweringScene Text Recognition	—Unverified
JSTR: Judgment Improves Scene Text Recognition	Apr 9, 2024	Scene Text Recognition	—Unverified
Learning Surrogates via Deep Embedding	Jul 1, 2020	Scene Text Recognition	—Unverified
LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition	Aug 24, 2023	DecoderScene Text Recognition	—Unverified
Lumos : Empowering Multimodal LLMs with Scene Text Recognition	Feb 12, 2024	Language ModelingLanguage Modelling	—Unverified
Memory Matters: Convolutional Recurrent Neural Network for Scene Text Recognition	Jan 6, 2016	Scene Text RecognitionSegmentation	—Unverified
Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition	Jul 25, 2023	Language ModellingOptical Character Recognition (OCR)	—Unverified
Multilingual Scene Character Recognition System using Sparse Auto-Encoder for Efficient Local Features Representation in Bag of Features	Jun 11, 2018	Deep LearningScene Text Recognition	—Unverified
On Calibration of Scene-Text Recognition Models	Dec 23, 2020	Scene Text Recognition	—Unverified
One Model for Two Tasks: Cooperatively Recognizing and Recovering Low-Resolution Scene Text Images by Iterative Mutual Guidance	Sep 22, 2024	Image Super-ResolutionScene Text Recognition	—Unverified

Show:10 25 50

← PrevPage 3 of 6Next →

All datasets ICDAR2013 SVT ICDAR2015 CUTE80 IIIT5k SVTP ICDAR 2003 WOST IC19-Art COCO-Text HOST Uber-Text

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L*	Accuracy	99.42	—	Unverified
2	DTrOCR 105M	Accuracy	99.4	—	Unverified
3	CLIP4STR-L (DataComp-1B)	Accuracy	99	—	Unverified
4	MGP-STR	Accuracy	98.5	—	Unverified
5	CLIP4STR-L	Accuracy	98.5	—	Unverified
6	CLIP4STR-B	Accuracy	98.3	—	Unverified
7	CCD-ViT-Base(ARD_2.8M)	Accuracy	98.3	—	Unverified
8	CCD-ViT-Small(ARD_2.8M)	Accuracy	98.3	—	Unverified
9	MATRN	Accuracy	97.9	—	Unverified
10	S-GTR	Accuracy	97.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-H (DFN-5B)	Accuracy	99.1	—	Unverified
2	DTrOCR 105M	Accuracy	98.9	—	Unverified
3	CLIP4STR-B*	Accuracy	98.76	—	Unverified
4	MGP-STR	Accuracy	98.6	—	Unverified
5	CLIP4STR-L (DataComp-1B)	Accuracy	98.6	—	Unverified
6	CLIP4STR-L	Accuracy	98.5	—	Unverified
7	CPPD	Accuracy	98.5	—	Unverified
8	CLIP4STR-B	Accuracy	98.3	—	Unverified
9	CCD-ViT-Base(ARD_2.8M)	Accuracy	97.8	—	Unverified
10	CCD-ViT-Small(ARD_2.8M)	Accuracy	96.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	93.5	—	Unverified
2	CLIP4STR-L*	Accuracy	92.6	—	Unverified
3	CPPD	Accuracy	91.7	—	Unverified
4	CLIP4STR-L (DataComp-1B)	Accuracy	91.4	—	Unverified
5	MGP-STR	Accuracy	90.9	—	Unverified
6	CLIP4STR-L	Accuracy	90.8	—	Unverified
7	CLIP4STR-B	Accuracy	90.6	—	Unverified
8	SIGA_S	Accuracy	87.6	—	Unverified
9	S-GTR	Accuracy	87.3	—	Unverified
10	MATRN	Accuracy	86.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPPD	Accuracy	99.7	—	Unverified
2	CLIP4STR-L (DataComp-1B)	Accuracy	99.7	—	Unverified
3	CLIP4STR-B*	Accuracy	99.65	—	Unverified
4	MGP-STR	Accuracy	99.31	—	Unverified
5	CLIP4STR-B	Accuracy	99.3	—	Unverified
6	DTrOCR 105M	Accuracy	99.1	—	Unverified
7	CLIP4STR-L	Accuracy	99	—	Unverified
8	CCD-ViT-Base(ARD_2.8M)	Accuracy	98.3	—	Unverified
9	CCD-ViT-Small(ARD_2.8M)	Accuracy	98.3	—	Unverified
10	CCD-ViT-Tiny(ARD_2.8M)	Accuracy	95.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	99.6	—	Unverified
2	CLIP4STR-L (DataComp-1B)	Accuracy	99.6	—	Unverified
3	CLIP4STR-L	Accuracy	99.5	—	Unverified
4	CLIP4STR-B (DataComp-1B)	Accuracy	99.5	—	Unverified
5	CPPD	Accuracy	99.3	—	Unverified
6	CLIP4STR-B	Accuracy	99.2	—	Unverified
7	MGP-STR	Accuracy	98.8	—	Unverified
8	CCD-ViT-Base(ARD_2.8M)	Accuracy	98	—	Unverified
9	CCD-ViT-Small(ARD_2.8M)	Accuracy	98	—	Unverified
10	S-GTR	Accuracy	97.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	98.6	—	Unverified
2	MGP-STR	Accuracy	98.3	—	Unverified
3	CLIP4STR-L*	Accuracy	98.13	—	Unverified
4	CLIP4STR-L (DataComp-1B)	Accuracy	98.1	—	Unverified
5	CLIP4STR-L	Accuracy	97.4	—	Unverified
6	CLIP4STR-B	Accuracy	97.2	—	Unverified
7	CPPD	Accuracy	96.7	—	Unverified
8	CCD-ViT-Base	Accuracy	96.1	—	Unverified
9	CCD-ViT-Small	Accuracy	92.7	—	Unverified
10	CCD-ViT-Tiny	Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Yet Another Text Recognizer	Accuracy	97.1	—	Unverified
2	SIGA_T	Accuracy	97	—	Unverified
3	SATRN	Accuracy	96.7	—	Unverified
4	DAN	Accuracy	95	—	Unverified
5	SAFL	Accuracy	95	—	Unverified
6	CSTR	Accuracy	94.8	—	Unverified
7	Baek et al.	Accuracy	94.4	—	Unverified
8	ViTSTR	Accuracy	94.3	—	Unverified
9	AON	Accuracy	91.5	—	Unverified
10	RARE	Accuracy	90.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-H (DFN-5B)	1:1 Accuracy	90.9	—	Unverified
2	CLIP4STR-L (DataComp-1B)	1:1 Accuracy	90.6	—	Unverified
3	CLIP4STR-L	1:1 Accuracy	88.8	—	Unverified
4	CLIP4STR-B	1:1 Accuracy	87	—	Unverified
5	CCD-ViT-Base	1:1 Accuracy	86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L (DataComp-1B)	Accuracy (%)	86.4	—	Unverified
2	CLIP4STR-L	Accuracy (%)	85.9	—	Unverified
3	CLIP4STR-B	Accuracy (%)	85.8	—	Unverified
4	MGP-STR	Accuracy (%)	85.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L	1:1 Accuracy	81.9	—	Unverified
2	MGP-STR	1:1 Accuracy	81.7	—	Unverified
3	CLIP4STR-B	1:1 Accuracy	81.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L	1:1 Accuracy	82.7	—	Unverified
2	CLIP4STR-B	1:1 Accuracy	79.8	—	Unverified
3	CCD-ViT-Base	1:1 Accuracy	77.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L (DataComp-1B)	Accuracy (%)	92.2	—	Unverified
2	MGP-STR	Accuracy (%)	91	—	Unverified
3	CLIP4STR-B	Accuracy (%)	86.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ABINet-LV+TPS++	Accuracy	97.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLDG	Average Accuracy	19.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ABINet-LV+TPS++	Accuracy	89.6	—	Unverified