Zero-Shot Image Classification

Zero-shot image classification is a technique in computer vision where a model can classify images into categories that were not present during training. This is achieved by leveraging semantic information about the categories, such as textual descriptions or relationships between classes.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–60 of 111 papers

Title	Date	Tasks	Status	Score
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion	Jul 15, 2024	image-classificationImage Classification	CodeCode Available	5
Towards Difficulty-Agnostic Efficient Transfer Learning for Vision-Language Models	Nov 27, 2023	General Knowledgeimage-classification	CodeCode Available	5
KPL: Training-Free Medical Knowledge Mining of Vision-Language Models	Jan 20, 2025	Classificationimage-classification	CodeCode Available	5
Learning from Children: Improving Image-Caption Pretraining via Curriculum	May 27, 2023	image-classificationImage Classification	CodeCode Available	5
Open-vocabulary vs. Closed-set: Best Practice for Few-shot Object Detection Considering Text Describability	Oct 20, 2024	Few-Shot Object Detectionimage-classification	CodeCode Available	5
Multilingual Vision-Language Pre-training for the Remote Sensing Domain	Oct 30, 2024	Cross-Modal Retrievalimage-classification	CodeCode Available	5
What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models	May 24, 2024	Classificationimage-classification	CodeCode Available	5
Language-Driven Anchors for Zero-Shot Adversarial Robustness	Jan 30, 2023	Adversarial DefenseAdversarial Robustness	CodeCode Available	5
Who's in and who's out? A case study of multimodal CLIP-filtering in DataComp	May 13, 2024	image-classificationImage Classification	CodeCode Available	5
Semantically-Prompted Language Models Improve Visual Descriptions	Jun 5, 2023	ClassificationDescriptive	—Unverified	0

Show:10 25 50

← PrevPage 6 of 12Next →

All datasets Country211 ICinW ODinW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OpenClip H/14 (34B)(Laion2B)	Top-1 accuracy	30.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP (ViT B-32)	Average Score	56.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIP (Tiny A)	Average Score	11.4	—	Unverified