Zero-Shot Image Classification

Zero-shot image classification is a technique in computer vision where a model can classify images into categories that were not present during training. This is achieved by leveraging semantic information about the categories, such as textual descriptions or relationships between classes.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 111 papers

Title	Date	Tasks	Status
Image-Caption Encoding for Improving Zero-Shot Generalization	Feb 5, 2024	image-classificationImage Classification	CodeCode Available
Segment Any Change	Feb 2, 2024	Change Detectionimage-classification	—Unverified
CLAMP: Contrastive LAnguage Model Prompt-tuning	Dec 4, 2023	Contrastive LearningImage Captioning	—Unverified
LightCLIP: Learning Multi-Level Interaction for Lightweight Vision-Language Models	Dec 1, 2023	image-classificationImage Classification	—Unverified
Towards Difficulty-Agnostic Efficient Transfer Learning for Vision-Language Models	Nov 27, 2023	General Knowledgeimage-classification	CodeCode Available
Efficient Model-Agnostic Multi-Group Equivariant Networks	Oct 14, 2023	Fairnessimage-classification	—Unverified
Noise-Tolerant Few-Shot Unsupervised Adapter for Vision-Language Models	Sep 26, 2023	image-classificationImage Classification	—Unverified
GrowCLIP: Data-aware Automatic Model Growing for Large-scale Contrastive Language-Image Pre-training	Aug 22, 2023	image-classificationImage Classification	—Unverified
Semantically-Prompted Language Models Improve Visual Descriptions	Jun 5, 2023	ClassificationDescriptive	—Unverified
Learning from Children: Improving Image-Caption Pretraining via Curriculum	May 27, 2023	image-classificationImage Classification	CodeCode Available
Text-to-Image Diffusion Models are Zero-Shot Classifiers	Mar 27, 2023	AttributeContrastive Learning	CodeCode Available
Language-Driven Anchors for Zero-Shot Adversarial Robustness	Jan 30, 2023	Adversarial DefenseAdversarial Robustness	CodeCode Available
Vision-Language Models Performing Zero-Shot Tasks Exhibit Gender-based Disparities	Jan 26, 2023	image-classificationImage Classification	—Unverified
RA-CLIP: Retrieval Augmented Contrastive Language-Image Pre-Training	Jan 1, 2023	Classificationimage-classification	—Unverified
DiRaC-I: Identifying Diverse and Rare Training Classes for Zero-Shot Learning	Dec 31, 2022	Active LearningAttribute	—Unverified
When are Lemons Purple? The Concept Association Bias of Vision-Language Models	Dec 22, 2022	Attributeimage-classification	—Unverified
CLIPPO: Image-and-Language Understanding from Pixels Only	Dec 15, 2022	Contrastive Learningimage-classification	—Unverified
I2MVFormer: Large Language Model Generated Multi-View Document Supervision for Zero-Shot Image Classification	Dec 5, 2022	Classificationimage-classification	—Unverified
Generative Negative Text Replay for Continual Vision-Language Pretraining	Oct 31, 2022	Continual Learningimage-classification	—Unverified
Text2Model: Text-based Model Induction for Zero-shot Image Classification	Oct 27, 2022	3D Point Cloud ClassificationAction Recognition	—Unverified
Efficient Multilingual Multi-modal Pre-training through Triple Contrastive Loss	Oct 1, 2022	image-classificationImage Classification	—Unverified
I2DFormer: Learning Image to Document Attention for Zero-Shot Image Classification	Sep 21, 2022	Generalized Zero-Shot Learningimage-classification	—Unverified
PaLI: A Jointly-Scaled Multilingual Language-Image Model	Sep 14, 2022	DecoderFew-Shot Image Classification	—Unverified
PyramidCLIP: Hierarchical Feature Alignment for Vision-language Model Pretraining	Apr 29, 2022	Image ClassificationLanguage Modeling	—Unverified
Wukong: A 100 Million Large-scale Chinese Cross-modal Pre-training Benchmark	Feb 14, 2022	BenchmarkingContrastive Learning	CodeCode Available

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets Country211 ICinW ODinW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OpenClip H/14 (34B)(Laion2B)	Top-1 accuracy	30.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP (ViT B-32)	Average Score	56.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIP (Tiny A)	Average Score	11.4	—	Unverified