Scene Text Recognition

See Scene Text Detection for leaderboards in this task.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 269 papers

Title	Date	Tasks	Status	Hype
SGBANet: Semantic GAN and Balanced Attention Network for Arbitrarily Oriented Scene Text Recognition	Jul 21, 2022	Image-to-Image TranslationScene Text Recognition	—Unverified	0
Scene Text Recognition with Permuted Autoregressive Sequence Models	Jul 14, 2022	Language ModelingLanguage Modelling	CodeCode Available	2
Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition	Jul 1, 2022	Contrastive LearningScene Text Recognition	CodeCode Available	1
GIT: A Generative Image-to-text Transformer for Vision and Language	May 27, 2022	DecoderImage Captioning	CodeCode Available	2
Multimodal Semi-Supervised Learning for Text Recognition	May 8, 2022	Language ModellingRepresentation Learning	CodeCode Available	1
SVTR: Scene Text Recognition with a Single Visual Model	Apr 30, 2022	Scene Text Recognition	CodeCode Available	0
Pushing the Performance Limit of Scene Text Recognizer without Human Annotation	Apr 16, 2022	Scene Text Recognition	CodeCode Available	1
IterVM: Iterative Vision Modeling Module for Scene Text Recognition	Apr 6, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
SimAN: Exploring Self-Supervised Representation Learning of Scene Text via Similarity-Aware Normalization	Mar 20, 2022	Common Sense ReasoningContrastive Learning	CodeCode Available	1
Training Protocol Matters: Towards Accurate Scene Text Recognition via Training Protocol Searching	Mar 13, 2022	CPUGPU	CodeCode Available	1
Towards Open-Set Text Recognition via Label-to-Prototype Learning	Mar 10, 2022	Scene Text Recognition	—Unverified	0
Text-DIAE: A Self-Supervised Degradation Invariant Autoencoders for Text Recognition and Document Enhancement	Mar 9, 2022	Document EnhancementImage Enhancement	CodeCode Available	1
Self-supervised Implicit Glyph Attention for Text Recognition	Mar 7, 2022	Scene Text RecognitionText Segmentation	CodeCode Available	1
Towards Boosting the Accuracy of Non-Latin Scene Text Recognition	Jan 10, 2022	Scene Text Recognition	CodeCode Available	0
Transfer Learning for Scene Text Recognition in Indian Languages	Jan 10, 2022	Scene Text RecognitionTransfer Learning	—Unverified	0
On the Cross-dataset Generalization in License Plate Recognition	Jan 2, 2022	Data AugmentationLicense Plate Detection	CodeCode Available	1
SAFL: A Self-Attention Scene Text Recognizer with Focal Loss	Jan 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0
Visual Semantics Allow for Textual Reasoning Better in Scene Text Recognition	Dec 24, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Text Gestalt: Stroke-Aware Scene Text Image Super-Resolution	Dec 13, 2021	Image Super-ResolutionScene Text Recognition	CodeCode Available	1
Visual-Semantic Transformer for Scene Text Recognition	Dec 2, 2021	Irregular Text RecognitionScene Text Recognition	—Unverified	0
Multi-modal Text Recognition Networks: Interactive Enhancements between Visual and Semantic Features	Nov 30, 2021	Scene Text Recognition	CodeCode Available	1
Traditional Chinese Synthetic Datasets Verified with Labeled Data for Scene Text Recognition	Nov 26, 2021	Scene Text Recognition	CodeCode Available	1
Decoupling Visual-Semantic Feature Learning for Robust Scene Text Recognition	Nov 24, 2021	DecoderScene Text Recognition	—Unverified	0
Utilizing Resource-Rich Language Datasets for End-to-End Scene Text Recognition in Resource-Poor Languages	Nov 24, 2021	DecoderImage to text	—Unverified	0
CDistNet: Perceiving Multi-Domain Character Distance for Robust Text Recognition	Nov 22, 2021	PositionScene Text Recognition	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 11Next →

All datasets ICDAR2013 SVT ICDAR2015 CUTE80 IIIT5k SVTP ICDAR 2003 WOST IC19-Art COCO-Text HOST Uber-Text

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L*	Accuracy	99.42	—	Unverified
2	DTrOCR 105M	Accuracy	99.4	—	Unverified
3	CLIP4STR-L (DataComp-1B)	Accuracy	99	—	Unverified
4	MGP-STR	Accuracy	98.5	—	Unverified
5	CLIP4STR-L	Accuracy	98.5	—	Unverified
6	CLIP4STR-B	Accuracy	98.3	—	Unverified
7	CCD-ViT-Base(ARD_2.8M)	Accuracy	98.3	—	Unverified
8	CCD-ViT-Small(ARD_2.8M)	Accuracy	98.3	—	Unverified
9	MATRN	Accuracy	97.9	—	Unverified
10	S-GTR	Accuracy	97.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-H (DFN-5B)	Accuracy	99.1	—	Unverified
2	DTrOCR 105M	Accuracy	98.9	—	Unverified
3	CLIP4STR-B*	Accuracy	98.76	—	Unverified
4	MGP-STR	Accuracy	98.6	—	Unverified
5	CLIP4STR-L (DataComp-1B)	Accuracy	98.6	—	Unverified
6	CLIP4STR-L	Accuracy	98.5	—	Unverified
7	CPPD	Accuracy	98.5	—	Unverified
8	CLIP4STR-B	Accuracy	98.3	—	Unverified
9	CCD-ViT-Base(ARD_2.8M)	Accuracy	97.8	—	Unverified
10	CCD-ViT-Small(ARD_2.8M)	Accuracy	96.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	93.5	—	Unverified
2	CLIP4STR-L*	Accuracy	92.6	—	Unverified
3	CPPD	Accuracy	91.7	—	Unverified
4	CLIP4STR-L (DataComp-1B)	Accuracy	91.4	—	Unverified
5	MGP-STR	Accuracy	90.9	—	Unverified
6	CLIP4STR-L	Accuracy	90.8	—	Unverified
7	CLIP4STR-B	Accuracy	90.6	—	Unverified
8	SIGA_S	Accuracy	87.6	—	Unverified
9	S-GTR	Accuracy	87.3	—	Unverified
10	MATRN	Accuracy	86.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPPD	Accuracy	99.7	—	Unverified
2	CLIP4STR-L (DataComp-1B)	Accuracy	99.7	—	Unverified
3	CLIP4STR-B*	Accuracy	99.65	—	Unverified
4	MGP-STR	Accuracy	99.31	—	Unverified
5	CLIP4STR-B	Accuracy	99.3	—	Unverified
6	DTrOCR 105M	Accuracy	99.1	—	Unverified
7	CLIP4STR-L	Accuracy	99	—	Unverified
8	CCD-ViT-Base(ARD_2.8M)	Accuracy	98.3	—	Unverified
9	CCD-ViT-Small(ARD_2.8M)	Accuracy	98.3	—	Unverified
10	CCD-ViT-Tiny(ARD_2.8M)	Accuracy	95.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	99.6	—	Unverified
2	CLIP4STR-L (DataComp-1B)	Accuracy	99.6	—	Unverified
3	CLIP4STR-L	Accuracy	99.5	—	Unverified
4	CLIP4STR-B (DataComp-1B)	Accuracy	99.5	—	Unverified
5	CPPD	Accuracy	99.3	—	Unverified
6	CLIP4STR-B	Accuracy	99.2	—	Unverified
7	MGP-STR	Accuracy	98.8	—	Unverified
8	CCD-ViT-Base(ARD_2.8M)	Accuracy	98	—	Unverified
9	CCD-ViT-Small(ARD_2.8M)	Accuracy	98	—	Unverified
10	S-GTR	Accuracy	97.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR 105M	Accuracy	98.6	—	Unverified
2	MGP-STR	Accuracy	98.3	—	Unverified
3	CLIP4STR-L*	Accuracy	98.13	—	Unverified
4	CLIP4STR-L (DataComp-1B)	Accuracy	98.1	—	Unverified
5	CLIP4STR-L	Accuracy	97.4	—	Unverified
6	CLIP4STR-B	Accuracy	97.2	—	Unverified
7	CPPD	Accuracy	96.7	—	Unverified
8	CCD-ViT-Base	Accuracy	96.1	—	Unverified
9	CCD-ViT-Small	Accuracy	92.7	—	Unverified
10	CCD-ViT-Tiny	Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Yet Another Text Recognizer	Accuracy	97.1	—	Unverified
2	SIGA_T	Accuracy	97	—	Unverified
3	SATRN	Accuracy	96.7	—	Unverified
4	DAN	Accuracy	95	—	Unverified
5	SAFL	Accuracy	95	—	Unverified
6	CSTR	Accuracy	94.8	—	Unverified
7	Baek et al.	Accuracy	94.4	—	Unverified
8	ViTSTR	Accuracy	94.3	—	Unverified
9	AON	Accuracy	91.5	—	Unverified
10	RARE	Accuracy	90.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-H (DFN-5B)	1:1 Accuracy	90.9	—	Unverified
2	CLIP4STR-L (DataComp-1B)	1:1 Accuracy	90.6	—	Unverified
3	CLIP4STR-L	1:1 Accuracy	88.8	—	Unverified
4	CLIP4STR-B	1:1 Accuracy	87	—	Unverified
5	CCD-ViT-Base	1:1 Accuracy	86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L (DataComp-1B)	Accuracy (%)	86.4	—	Unverified
2	CLIP4STR-L	Accuracy (%)	85.9	—	Unverified
3	CLIP4STR-B	Accuracy (%)	85.8	—	Unverified
4	MGP-STR	Accuracy (%)	85.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L	1:1 Accuracy	81.9	—	Unverified
2	MGP-STR	1:1 Accuracy	81.7	—	Unverified
3	CLIP4STR-B	1:1 Accuracy	81.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L	1:1 Accuracy	82.7	—	Unverified
2	CLIP4STR-B	1:1 Accuracy	79.8	—	Unverified
3	CCD-ViT-Base	1:1 Accuracy	77.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4STR-L (DataComp-1B)	Accuracy (%)	92.2	—	Unverified
2	MGP-STR	Accuracy (%)	91	—	Unverified
3	CLIP4STR-B	Accuracy (%)	86.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ABINet-LV+TPS++	Accuracy	97.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLDG	Average Accuracy	19.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ABINet-LV+TPS++	Accuracy	89.6	—	Unverified