SOTAVerified|Agents Browse Leaderboard About Blog

Zero-Shot Transfer Image Classification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–19 of 19 papers

Title	Date	Tasks	Status	Hype
AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities	Nov 12, 2022	Contrastive LearningCross-Modal Retrieval	CodeCode Available	4
Your Diffusion Model is Secretly a Zero-Shot Classifier	Mar 28, 2023	Domain GeneralizationFine-Grained Image Classification	CodeCode Available	2
Learning Transferable Visual Models From Natural Language Supervision	Feb 26, 2021	Action RecognitionBenchmarking	CodeCode Available	2
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision	Feb 11, 2021	Cross-Modal RetrievalFine-Grained Image Classification	CodeCode Available	2
CoCa: Contrastive Captioners are Image-Text Foundation Models	May 4, 2022	Action ClassificationDecoder	CodeCode Available	1
Distilling Large Vision-Language Model with Out-of-Distribution Generalizability	Jul 6, 2023	Few-Shot Image ClassificationImage Classification	CodeCode Available	1
EVA-CLIP: Improved Training Techniques for CLIP at Scale	Mar 27, 2023	Image ClassificationRepresentation Learning	CodeCode Available	1
Florence: A New Foundation Model for Computer Vision	Nov 22, 2021	Action ClassificationAction Recognition	CodeCode Available	1
InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks	Dec 21, 2023	Image RetrievalImage-to-Text Retrieval	CodeCode Available	1
Learning Customized Visual Models with Retrieval-Augmented Knowledge	Jan 17, 2023	Contrastive LearningRetrieval	CodeCode Available	1
The effectiveness of MAE pre-pretraining for billion-scale pretraining	Mar 23, 2023	Action ClassificationAction Recognition	CodeCode Available	1
LiT: Zero-Shot Transfer with Locked-image text Tuning	Nov 15, 2021	image-classificationImage Classification	CodeCode Available	1
PaLI: A Jointly-Scaled Multilingual Language-Image Model	Sep 14, 2022	DecoderFew-Shot Image Classification	—Unverified	0
Combined Scaling for Zero-shot Transfer Learning	Nov 19, 2021	ClassificationContrastive Learning	—Unverified	0
Learning Visual N-Grams from Web Data	Dec 29, 2016	Language ModelingLanguage Modelling	—Unverified	0
Alternating Gradient Descent and Mixture-of-Experts for Integrated Multimodal Perception	May 10, 2023	Classificationimage-classification	—Unverified	0
EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters	Feb 6, 2024	image-classificationImage Classification	CodeCode Available	0
M2-Encoder: Advancing Bilingual Image-Text Understanding by Large-scale Efficient Pretraining	Jan 29, 2024	GPUzero-shot-classification	CodeCode Available	0
Scaling Vision Transformers to 22 Billion Parameters	Feb 10, 2023	Action ClassificationFairness	CodeCode Available	0

Show:10 25 50

All datasets ImageNet ImageNet-A ImageNet V2 ImageNet-R ObjectNet ImageNet-Sketch Food-101 SUN aYahoo CN-ImageNet CN-ImageNet-A CN-ImageNet-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	M2-Encoder	Accuracy (Private)	88.5	—	Unverified
2	BASIC (Lion)	Accuracy (Private)	88.3	—	Unverified
3	CoCa	Accuracy (Private)	86.3	—	Unverified
4	LiT-22B	Accuracy (Private)	85.9	—	Unverified
5	BASIC	Accuracy (Private)	85.7	—	Unverified
6	LiT ViT-e	Accuracy (Private)	85.4	—	Unverified
7	LiT-tuning	Accuracy (Private)	84.5	—	Unverified
8	IMP-MoE-L	Accuracy (Private)	83.9	—	Unverified
9	EVA-CLIP-18B	Accuracy (Private)	83.8	—	Unverified
10	InternVL-C	Accuracy (Private)	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CoCa	Accuracy (Private)	90.2	—	Unverified
2	LiT-22B	Accuracy (Private)	90.1	—	Unverified
3	LiT ViT-e	Accuracy (Private)	88	—	Unverified
4	EVA-CLIP-18B	Accuracy (Private)	87.3	—	Unverified
5	BASIC (Lion)	Accuracy (Private)	86.4	—	Unverified
6	BASIC	Accuracy (Private)	85.6	—	Unverified
7	InternVL-C	Accuracy (Private)	83.8	—	Unverified
8	EVA-CLIP-E/14+	Accuracy (Private)	82.1	—	Unverified
9	LiT-tuning	Accuracy (Private)	79.4	—	Unverified
10	CLIP	Accuracy (Private)	77.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BASIC (Lion)	Accuracy (Private)	81.2	—	Unverified
2	LiT-22B	Accuracy (Private)	80.9	—	Unverified
3	CoCa	Accuracy (Private)	80.7	—	Unverified
4	BASIC	Accuracy (Private)	80.6	—	Unverified
5	LiT ViT-e	Accuracy (Private)	80.6	—	Unverified
6	LiT-tuning	Accuracy (Private)	78.7	—	Unverified
7	EVA-CLIP-18B	Accuracy (Private)	77.9	—	Unverified
8	InternVL-C	Accuracy (Private)	77.3	—	Unverified
9	EVA-CLIP-E/14+	Accuracy (Private)	75.7	—	Unverified
10	ALIGN	Accuracy (Private)	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BASIC (Lion)	Accuracy	96.8	—	Unverified
2	CoCa	Accuracy	96.5	—	Unverified
3	LiT ViT-e	Accuracy	96.1	—	Unverified
4	LiT-22B	Accuracy	96	—	Unverified
5	BASIC	Accuracy	95.7	—	Unverified
6	EVA-CLIP-18B	Accuracy	95.7	—	Unverified
7	EVA-CLIP-E/14+	Accuracy	94.5	—	Unverified
8	LiT-tuning	Accuracy	93.9	—	Unverified
9	ALIGN	Accuracy	92.2	—	Unverified
10	CLIP	Accuracy	88.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LiT-22B	Accuracy (Private)	87.6	—	Unverified
2	LiT ViT-e	Accuracy (Private)	84.9	—	Unverified
3	CoCa	Accuracy (Private)	82.7	—	Unverified
4	EVA-CLIP-18B	Accuracy (Private)	82.2	—	Unverified
5	LiT-tuning	Accuracy (Private)	81.1	—	Unverified
6	InternVL-C	Accuracy (Private)	80.6	—	Unverified
7	EVA-CLIP-E/14+	Accuracy (Private)	79.6	—	Unverified
8	CLIP	Accuracy (Private)	72.3	—	Unverified
9	PaLI	Accuracy (Private)	42.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CoCa	Accuracy (Private)	77.6	—	Unverified
2	BASIC (Lion)	Accuracy (Private)	77.2	—	Unverified
3	BASIC	Accuracy (Private)	76.1	—	Unverified
4	EVA-CLIP-18B	Accuracy (Private)	74.7	—	Unverified
5	InternVL-C	Accuracy (Private)	73.9	—	Unverified
6	EVA-CLIP-E/14+	Accuracy (Private)	71.6	—	Unverified
7	AltCLIP	Accuracy (Private)	58.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAWS (ViT-2B)	Top 1 Accuracy	96.2	—	Unverified
2	EVA-CLIP-18B	Top 1 Accuracy	95.8	—	Unverified
3	InternVL-C	Top 1 Accuracy	95.3	—	Unverified
4	EVA-CLIP-E/14+	Top 1 Accuracy	94.9	—	Unverified
5	Diffusion Classifier (zero-shot)	Top 1 Accuracy	77.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EVA-CLIP-18B	Accuracy	77.7	—	Unverified
2	CLIP	Accuracy	58.5	—	Unverified
3	Visual N-Grams	Accuracy	23	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP	Accuracy	98.4	—	Unverified
2	Visual N-Grams	Accuracy	72.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternVL-C	Accuracy (Private)	64.5	—	Unverified
2	AltCLIP	Accuracy (Private)	59.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AltCLIP	Accuracy (Private)	58.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AltCLIP	Accuracy (Private)	79.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AltCLIP	Accuracy (Private)	46.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AltCLIP	Accuracy (Private)	50.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LiT-tuning	Accuracy (Private)	88	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLI	Accuracy (Private)	63.83	—	Unverified