Zero-Shot Image Classification

Zero-shot image classification is a technique in computer vision where a model can classify images into categories that were not present during training. This is achieved by leveraging semantic information about the categories, such as textual descriptions or relationships between classes.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 111 papers

Title	Date	Tasks	Status
Efficient Model-Agnostic Multi-Group Equivariant Networks	Oct 14, 2023	Fairnessimage-classification	—Unverified
Efficient Multilingual Multi-modal Pre-training through Triple Contrastive Loss	Oct 1, 2022	image-classificationImage Classification	—Unverified
Exploring Low-Resource Medical Image Classification with Weakly Supervised Prompt Learning	Feb 6, 2024	Few-Shot Learningimage-classification	—Unverified
Gaze Embeddings for Zero-Shot Image Classification	Nov 28, 2016	ClassificationFine-Grained Image Classification	—Unverified
Generative Negative Text Replay for Continual Vision-Language Pretraining	Oct 31, 2022	Continual Learningimage-classification	—Unverified
GrowCLIP: Data-aware Automatic Model Growing for Large-scale Contrastive Language-Image Pre-training	Aug 22, 2023	image-classificationImage Classification	—Unverified
I2DFormer: Learning Image to Document Attention for Zero-Shot Image Classification	Sep 21, 2022	Generalized Zero-Shot Learningimage-classification	—Unverified
I2MVFormer: Large Language Model Generated Multi-View Document Supervision for Zero-Shot Image Classification	Dec 5, 2022	Classificationimage-classification	—Unverified
CLIPPO: Image-and-Language Understanding from Pixels Only	Dec 15, 2022	Contrastive Learningimage-classification	—Unverified
Improving Semantic Embedding Consistency by Metric Learning for Zero-Shot Classification	Jul 27, 2016	AttributeGeneral Classification	—Unverified
Integrating Propositional and Relational Label Side Information for Hierarchical Zero-Shot Image Classification	Feb 14, 2019	AttributeGeneral Classification	—Unverified
It's Not a Modality Gap: Characterizing and Addressing the Contrastive Gap	May 28, 2024	image-classificationImage Classification	—Unverified
Language to Network: Conditional Parameter Adaptation with Natural Language Descriptions	Jul 1, 2020	General Classificationimage-classification	—Unverified
Large-Scale Zero-Shot Image Classification from Rich and Diverse Textual Descriptions	Mar 17, 2021	ArticlesGeneral Classification	—Unverified
Multimodal Adversarial Defense for Vision-Language Models by Leveraging One-To-Many Relationships	May 29, 2024	Adversarial DefenseAdversarial Robustness	—Unverified
LightCLIP: Learning Multi-Level Interaction for Lightweight Vision-Language Models	Dec 1, 2023	image-classificationImage Classification	—Unverified
LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Model	Oct 3, 2024	image-classificationImage Classification	—Unverified
MADS: Multi-Attribute Document Supervision for Zero-Shot Image Classification	Mar 10, 2025	Attributeimage-classification	—Unverified
MoDE: CLIP Data Experts via Clustering	Apr 24, 2024	Clusteringimage-classification	—Unverified
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified
Noise-Tolerant Few-Shot Unsupervised Adapter for Vision-Language Models	Sep 26, 2023	image-classificationImage Classification	—Unverified
PaLI: A Jointly-Scaled Multilingual Language-Image Model	Sep 14, 2022	DecoderFew-Shot Image Classification	—Unverified
PyramidCLIP: Hierarchical Feature Alignment for Vision-language Model Pretraining	Apr 29, 2022	Image ClassificationLanguage Modeling	—Unverified
RA-CLIP: Retrieval Augmented Contrastive Language-Image Pre-Training	Jan 1, 2023	Classificationimage-classification	—Unverified
Retaining Knowledge and Enhancing Long-Text Representations in CLIP through Dual-Teacher Distillation	Jan 1, 2025	image-classificationImage Classification	—Unverified

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets Country211 ICinW ODinW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OpenClip H/14 (34B)(Laion2B)	Top-1 accuracy	30.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP (ViT B-32)	Average Score	56.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIP (Tiny A)	Average Score	11.4	—	Unverified