Scene Text Recognition

See Scene Text Detection for leaderboards in this task.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 269 papers

Title	Date	Tasks	Status
Sequence to sequence learning for unconstrained scene text recognition	Jul 20, 2016	Scene Text Recognition	—Unverified
Sequential Visual and Semantic Consistency for Semi-supervised Text Recognition	Feb 24, 2024	Scene Text RecognitionSemantic Similarity	—Unverified
SGBANet: Semantic GAN and Balanced Attention Network for Arbitrarily Oriented Scene Text Recognition	Jul 21, 2022	Image-to-Image TranslationScene Text Recognition	—Unverified
Sharp Attention for Sequence to Sequence Learning	Sep 29, 2021	Hard AttentionScene Text Recognition	—Unverified
Cursive Scene Text Analysis by Deep Convolutional Linear Pyramids	Sep 27, 2018	object-detectionObject Detection	—Unverified
Revisiting Classification Perspective on Scene Text Recognition	Feb 22, 2021	ClassificationGeneral Classification	—Unverified
Simultaneous Recognition of Horizontal and Vertical Text in Natural Images	Dec 6, 2018	Scene Text Recognition	—Unverified
Smart Library: Identifying Books in a Library using Richly Supervised Deep Scene Text Reading	Nov 22, 2016	ManagementRetrieval	—Unverified
Why You Should Try the Real Data for the Scene Text Recognition	Jul 29, 2021	DiversityScene Text Recognition	—Unverified
Star-net: A spatial attention residue network for scene text recognition.	Sep 20, 2016	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
2D-CTC for Scene Text Recognition	Jul 23, 2019	DecoderScene Text Recognition	—Unverified
Context Perception Parallel Decoder for Scene Text Recognition	Jul 23, 2023	DecoderLanguage Modelling	—Unverified
STR-Cert: Robustness Certification for Deep Text Recognition on Deep Learning Pipelines and Vision Transformers	Nov 28, 2023	Scene Text Recognition	—Unverified
STRIDE : Scene Text Recognition In-Device	May 17, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Strokelets: A Learned Multi-Scale Representation for Scene Text Recognition	Jun 1, 2014	Scene Text DetectionScene Text Recognition	—Unverified
Visual-Semantic Transformer for Scene Text Recognition	Dec 2, 2021	Irregular Text RecognitionScene Text Recognition	—Unverified
SVTRv2: CTC Beats Encoder-Decoder Models in Scene Text Recognition	Nov 24, 2024	DecoderOptical Character Recognition (OCR)	—Unverified
Context-Aware Selective Label Smoothing for Calibrating Sequence Recognition Model	Mar 13, 2023	Decision MakingScene Text Recognition	—Unverified
Symmetry-constrained Rectification Network for Scene Text Recognition	Aug 6, 2019	DiversityScene Text Recognition	—Unverified
Synthetically Supervised Feature Learning for Scene Text Recognition	Sep 1, 2018	Scene Text RecognitionSynthetic Data Generation	—Unverified
CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition	Jan 18, 2024	PositionScene Text Recognition	—Unverified
CLIPTER: Looking at the Bigger Picture in Scene Text Recognition	Jan 18, 2023	Language ModelingLanguage Modelling	—Unverified
Choose What You Need: Disentangled Representation Learning for Scene Text Recognition Removal and Editing	Jan 1, 2024	DecoderRepresentation Learning	—Unverified
VL-Reader: Vision and Language Reconstructor is an Effective Scene Text Recognizer	Sep 18, 2024	DecoderScene Text Recognition	—Unverified
Choose What You Need: Disentangled Representation Learning for Scene Text Recognition, Removal and Editing	May 7, 2024	DecoderRepresentation Learning	—Unverified
Char-Net: A Character-Aware Neural Network for Distorted Scene Text Recognition	Apr 27, 2018	DecoderScene Text Recognition	—Unverified
Text Image Generation for Low-Resource Languages with Dual Translation Learning	Sep 26, 2024	DiversityImage Generation	—Unverified
FACLSTM: ConvLSTM with Focused Attention for Scene Text Recognition	Apr 20, 2019	PredictionScene Text Recognition	—Unverified
Text is Text, No Matter What: Unifying Text Recognition using Knowledge Distillation	Jul 26, 2021	Handwriting RecognitionHTR	—Unverified
Text Recognition in Real Scenarios with a Few Labeled Samples	Jun 22, 2020	Domain AdaptationScene Text Recognition	—Unverified
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified
TextScanner: Reading Characters in Order for Robust Scene Text Recognition	Dec 28, 2019	PositionScene Text Recognition	—Unverified
Billet Number Recognition Based on Test-Time Adaptation	Feb 13, 2025	Scene Text RecognitionTest-time Adaptation	—Unverified
Benchmarking Scene Text Recognition in Devanagari, Telugu and Malayalam	Apr 9, 2021	BenchmarkingScene Text Recognition	—Unverified
Weakly Supervised Scene Text Generation for Low-resource Languages	Jun 25, 2023	Scene Text RecognitionText Generation	—Unverified
JSTR: Judgment Improves Scene Text Recognition	Apr 9, 2024	Scene Text Recognition	—Unverified
LEGO: Self-Supervised Representation Learning for Scene Text Images	Aug 4, 2024	Representation LearningScene Text Recognition	—Unverified
Learning Surrogates via Deep Embedding	Jul 1, 2020	Scene Text Recognition	—Unverified
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks	Mar 27, 2020	Optical Character Recognition (OCR)Scene Text Recognition	—Unverified
Instruction-Guided Scene Text Recognition	Jan 31, 2024	Question AnsweringScene Text Recognition	—Unverified
IndicSTR12: A Dataset for Indic Scene Text Recognition	Mar 12, 2024	BenchmarkingScene Text Recognition	—Unverified
LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition	Aug 24, 2023	DecoderScene Text Recognition	—Unverified
1st Place Solution to ECCV 2022 Challenge on Out of Vocabulary Scene Text Understanding: End-to-End Recognition of Out of Vocabulary Words	Sep 1, 2022	Autonomous DrivingScene Text Recognition	—Unverified
Improving Scene Text Recognition for Character-Level Long-Tailed Distribution	Mar 31, 2023	Scene Text Recognition	—Unverified
Lumos : Empowering Multimodal LLMs with Scene Text Recognition	Feb 12, 2024	Language ModelingLanguage Modelling	—Unverified
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified
Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory	Nov 5, 2019	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Towards Open-Set Text Recognition via Label-to-Prototype Learning	Mar 10, 2022	Scene Text Recognition	—Unverified
IFR: Iterative Fusion Based Recognizer For Low Quality Scene Text Recognition	Aug 13, 2021	Image RestorationScene Text Recognition	—Unverified
Augmented Transformers with Adaptive n-grams Embedding for Multilingual Scene Text Recognition	Feb 28, 2023	Language IdentificationScene Text Recognition	—Unverified

Show:10 25 50

← PrevPage 5 of 6Next →

All datasets ICDAR2013 SVT ICDAR2015 CUTE80 IIIT5k SVTP ICDAR 2003 WOST IC19-Art COCO-Text HOST Uber-Text

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L*	Accuracy	99.42	—	Unverified
2	DTrOCR 105M	Accuracy	99.4	—	Unverified
3	CLIP4STR-L (DataComp-1B)	Accuracy	99	—	Unverified
4	MGP-STR	Accuracy	98.5	—	Unverified
5	CLIP4STR-L	Accuracy	98.5	—	Unverified
6	CLIP4STR-B	Accuracy	98.3	—	Unverified
7	CCD-ViT-Base(ARD_2.8M)	Accuracy	98.3	—	Unverified
8	CCD-ViT-Small(ARD_2.8M)	Accuracy	98.3	—	Unverified
9	MATRN	Accuracy	97.9	—	Unverified
10	S-GTR	Accuracy	97.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-H (DFN-5B)	Accuracy	99.1	—	Unverified
2	DTrOCR 105M	Accuracy	98.9	—	Unverified
3	CLIP4STR-B*	Accuracy	98.76	—	Unverified
4	MGP-STR	Accuracy	98.6	—	Unverified
5	CLIP4STR-L (DataComp-1B)	Accuracy	98.6	—	Unverified
6	CLIP4STR-L	Accuracy	98.5	—	Unverified
7	CPPD	Accuracy	98.5	—	Unverified
8	CLIP4STR-B	Accuracy	98.3	—	Unverified
9	CCD-ViT-Base(ARD_2.8M)	Accuracy	97.8	—	Unverified
10	CCD-ViT-Small(ARD_2.8M)	Accuracy	96.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	93.5	—	Unverified
2	CLIP4STR-L*	Accuracy	92.6	—	Unverified
3	CPPD	Accuracy	91.7	—	Unverified
4	CLIP4STR-L (DataComp-1B)	Accuracy	91.4	—	Unverified
5	MGP-STR	Accuracy	90.9	—	Unverified
6	CLIP4STR-L	Accuracy	90.8	—	Unverified
7	CLIP4STR-B	Accuracy	90.6	—	Unverified
8	SIGA_S	Accuracy	87.6	—	Unverified
9	S-GTR	Accuracy	87.3	—	Unverified
10	MATRN	Accuracy	86.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPPD	Accuracy	99.7	—	Unverified
2	CLIP4STR-L (DataComp-1B)	Accuracy	99.7	—	Unverified
3	CLIP4STR-B*	Accuracy	99.65	—	Unverified
4	MGP-STR	Accuracy	99.31	—	Unverified
5	CLIP4STR-B	Accuracy	99.3	—	Unverified
6	DTrOCR 105M	Accuracy	99.1	—	Unverified
7	CLIP4STR-L	Accuracy	99	—	Unverified
8	CCD-ViT-Base(ARD_2.8M)	Accuracy	98.3	—	Unverified
9	CCD-ViT-Small(ARD_2.8M)	Accuracy	98.3	—	Unverified
10	CCD-ViT-Tiny(ARD_2.8M)	Accuracy	95.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	99.6	—	Unverified
2	CLIP4STR-L (DataComp-1B)	Accuracy	99.6	—	Unverified
3	CLIP4STR-L	Accuracy	99.5	—	Unverified
4	CLIP4STR-B (DataComp-1B)	Accuracy	99.5	—	Unverified
5	CPPD	Accuracy	99.3	—	Unverified
6	CLIP4STR-B	Accuracy	99.2	—	Unverified
7	MGP-STR	Accuracy	98.8	—	Unverified
8	CCD-ViT-Base(ARD_2.8M)	Accuracy	98	—	Unverified
9	CCD-ViT-Small(ARD_2.8M)	Accuracy	98	—	Unverified
10	S-GTR	Accuracy	97.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	98.6	—	Unverified
2	MGP-STR	Accuracy	98.3	—	Unverified
3	CLIP4STR-L*	Accuracy	98.13	—	Unverified
4	CLIP4STR-L (DataComp-1B)	Accuracy	98.1	—	Unverified
5	CLIP4STR-L	Accuracy	97.4	—	Unverified
6	CLIP4STR-B	Accuracy	97.2	—	Unverified
7	CPPD	Accuracy	96.7	—	Unverified
8	CCD-ViT-Base	Accuracy	96.1	—	Unverified
9	CCD-ViT-Small	Accuracy	92.7	—	Unverified
10	CCD-ViT-Tiny	Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Yet Another Text Recognizer	Accuracy	97.1	—	Unverified
2	SIGA_T	Accuracy	97	—	Unverified
3	SATRN	Accuracy	96.7	—	Unverified
4	DAN	Accuracy	95	—	Unverified
5	SAFL	Accuracy	95	—	Unverified
6	CSTR	Accuracy	94.8	—	Unverified
7	Baek et al.	Accuracy	94.4	—	Unverified
8	ViTSTR	Accuracy	94.3	—	Unverified
9	AON	Accuracy	91.5	—	Unverified
10	RARE	Accuracy	90.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-H (DFN-5B)	1:1 Accuracy	90.9	—	Unverified
2	CLIP4STR-L (DataComp-1B)	1:1 Accuracy	90.6	—	Unverified
3	CLIP4STR-L	1:1 Accuracy	88.8	—	Unverified
4	CLIP4STR-B	1:1 Accuracy	87	—	Unverified
5	CCD-ViT-Base	1:1 Accuracy	86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L (DataComp-1B)	Accuracy (%)	86.4	—	Unverified
2	CLIP4STR-L	Accuracy (%)	85.9	—	Unverified
3	CLIP4STR-B	Accuracy (%)	85.8	—	Unverified
4	MGP-STR	Accuracy (%)	85.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L	1:1 Accuracy	81.9	—	Unverified
2	MGP-STR	1:1 Accuracy	81.7	—	Unverified
3	CLIP4STR-B	1:1 Accuracy	81.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L	1:1 Accuracy	82.7	—	Unverified
2	CLIP4STR-B	1:1 Accuracy	79.8	—	Unverified
3	CCD-ViT-Base	1:1 Accuracy	77.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L (DataComp-1B)	Accuracy (%)	92.2	—	Unverified
2	MGP-STR	Accuracy (%)	91	—	Unverified
3	CLIP4STR-B	Accuracy (%)	86.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ABINet-LV+TPS++	Accuracy	97.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLDG	Average Accuracy	19.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ABINet-LV+TPS++	Accuracy	89.6	—	Unverified