Zero-Shot Image Classification

Zero-shot image classification is a technique in computer vision where a model can classify images into categories that were not present during training. This is achieved by leveraging semantic information about the categories, such as textual descriptions or relationships between classes.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 111 papers

Title	Date	Tasks	Status
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
A Fistful of Words: Learning Transferable Visual Models from Bag-of-Words Supervision	Dec 27, 2021	ClassificationImage Captioning	—Unverified
Altogether: Image Captioning via Re-aligning Alt-text	Oct 22, 2024	Image Captioningimage-classification	—Unverified
A Progressive Framework of Vision-language Knowledge Distillation and Alignment for Multilingual Scene	Apr 17, 2024	image-classificationImage Classification	—Unverified
BaFTA: Backprop-Free Test-Time Adaptation For Zero-Shot Vision-Language Models	Jun 17, 2024	image-classificationImage Classification	—Unverified
Bayesian Test-Time Adaptation for Vision-Language Models	Mar 12, 2025	image-classificationImage Classification	—Unverified
Beyond the Visible: Multispectral Vision-Language Learning for Earth Observation	Mar 20, 2025	Contrastive LearningEarth Observation	—Unverified
Bridge the Modality and Capability Gaps in Vision-Language Model Selection	Mar 20, 2024	Capacity Estimationimage-classification	—Unverified
CIBR: Cross-modal Information Bottleneck Regularization for Robust CLIP Generalization	Mar 31, 2025	Contrastive Learningimage-classification	—Unverified
CLAMP: Contrastive LAnguage Model Prompt-tuning	Dec 4, 2023	Contrastive LearningImage Captioning	—Unverified

Show:10 25 50

← PrevPage 7 of 12Next →

All datasets Country211 ICinW ODinW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OpenClip H/14 (34B)(Laion2B)	Top-1 accuracy	30.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP (ViT B-32)	Average Score	56.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIP (Tiny A)	Average Score	11.4	—	Unverified