Zero-Shot Image Classification

Zero-shot image classification is a technique in computer vision where a model can classify images into categories that were not present during training. This is achieved by leveraging semantic information about the categories, such as textual descriptions or relationships between classes.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 111 papers

Title	Date	Tasks	Status
Multimodal Adversarial Defense for Vision-Language Models by Leveraging One-To-Many Relationships	May 29, 2024	Adversarial DefenseAdversarial Robustness	—Unverified
LightCLIP: Learning Multi-Level Interaction for Lightweight Vision-Language Models	Dec 1, 2023	image-classificationImage Classification	—Unverified
LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Model	Oct 3, 2024	image-classificationImage Classification	—Unverified
MADS: Multi-Attribute Document Supervision for Zero-Shot Image Classification	Mar 10, 2025	Attributeimage-classification	—Unverified
MoDE: CLIP Data Experts via Clustering	Apr 24, 2024	Clusteringimage-classification	—Unverified
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified
Noise-Tolerant Few-Shot Unsupervised Adapter for Vision-Language Models	Sep 26, 2023	image-classificationImage Classification	—Unverified
PaLI: A Jointly-Scaled Multilingual Language-Image Model	Sep 14, 2022	DecoderFew-Shot Image Classification	—Unverified
PyramidCLIP: Hierarchical Feature Alignment for Vision-language Model Pretraining	Apr 29, 2022	Image ClassificationLanguage Modeling	—Unverified
RA-CLIP: Retrieval Augmented Contrastive Language-Image Pre-Training	Jan 1, 2023	Classificationimage-classification	—Unverified
Retaining Knowledge and Enhancing Long-Text Representations in CLIP through Dual-Teacher Distillation	Jan 1, 2025	image-classificationImage Classification	—Unverified
Retrieval-enriched zero-shot image classification in low-resource domains	Nov 1, 2024	image-classificationImage Classification	—Unverified
Segment Any Change	Feb 2, 2024	Change Detectionimage-classification	—Unverified
Semantic Compositions Enhance Vision-Language Contrastive Learning	Jul 1, 2024	ClassificationContrastive Learning	—Unverified
Soundify: Matching Sound Effects to Video	Dec 17, 2021	Audio GenerationImage Classification	—Unverified
Text2Model: Text-based Model Induction for Zero-shot Image Classification	Oct 27, 2022	3D Point Cloud ClassificationAction Recognition	—Unverified
TripletCLIP: Improving Compositional Reasoning of CLIP via Synthetic Vision-Language Negatives	Nov 4, 2024	Diversityimage-classification	—Unverified
Vision-Language Models Performing Zero-Shot Tasks Exhibit Gender-based Disparities	Jan 26, 2023	image-classificationImage Classification	—Unverified
Visual-Semantic Embedding Model Informed by Structured Knowledge	Sep 21, 2020	ClassificationGeneral Classification	—Unverified
When are Lemons Purple? The Concept Association Bias of Vision-Language Models	Dec 22, 2022	Attributeimage-classification	—Unverified
Zero-sample surface defect detection and classification based on semantic feedback neural network	Jun 15, 2021	AttributeDefect Detection	—Unverified
Zero-Shot Image Classification Using Coupled Dictionary Embedding	Jun 10, 2019	AttributeClassification	—Unverified
Learning from Children: Improving Image-Caption Pretraining via Curriculum	May 27, 2023	image-classificationImage Classification	CodeCode Available
DPA: Dual Prototypes Alignment for Unsupervised Adaptation of Vision-Language Models	Aug 16, 2024	Domain Adaptationimage-classification	CodeCode Available
KPL: Training-Free Medical Knowledge Mining of Vision-Language Models	Jan 20, 2025	Classificationimage-classification	CodeCode Available

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets Country211 ICinW ODinW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OpenClip H/14 (34B)(Laion2B)	Top-1 accuracy	30.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP (ViT B-32)	Average Score	56.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIP (Tiny A)	Average Score	11.4	—	Unverified