Zero-Shot Image Classification

Zero-shot image classification is a technique in computer vision where a model can classify images into categories that were not present during training. This is achieved by leveraging semantic information about the categories, such as textual descriptions or relationships between classes.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 111 papers

Title	Date	Tasks	Status
KPL: Training-Free Medical Knowledge Mining of Vision-Language Models	Jan 20, 2025	Classificationimage-classification	CodeCode Available
Retaining Knowledge and Enhancing Long-Text Representations in CLIP through Dual-Teacher Distillation	Jan 1, 2025	image-classificationImage Classification	—Unverified
CLIP-PING: Boosting Lightweight Vision-Language Models with Proximus Intrinsic Neighbors Guidance	Dec 5, 2024	Contrastive Learningcross-modal alignment	—Unverified
TripletCLIP: Improving Compositional Reasoning of CLIP via Synthetic Vision-Language Negatives	Nov 4, 2024	Diversityimage-classification	—Unverified
Retrieval-enriched zero-shot image classification in low-resource domains	Nov 1, 2024	image-classificationImage Classification	—Unverified
Multilingual Vision-Language Pre-training for the Remote Sensing Domain	Oct 30, 2024	Cross-Modal Retrievalimage-classification	CodeCode Available
Altogether: Image Captioning via Re-aligning Alt-text	Oct 22, 2024	Image Captioningimage-classification	CodeCode Available
Open-vocabulary vs. Closed-set: Best Practice for Few-shot Object Detection Considering Text Describability	Oct 20, 2024	Few-Shot Object Detectionimage-classification	CodeCode Available
CSA: Data-efficient Mapping of Unimodal Features to Multimodal Features	Oct 10, 2024	Cross-Modal RetrievalGPU	—Unverified
LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Model	Oct 3, 2024	image-classificationImage Classification	—Unverified
DPA: Dual Prototypes Alignment for Unsupervised Adaptation of Vision-Language Models	Aug 16, 2024	Domain Adaptationimage-classification	CodeCode Available
Do Vision-Language Foundational models show Robust Visual Perception?	Aug 13, 2024	image-classificationImage Classification	CodeCode Available
CoAPT: Context Attribute words for Prompt Tuning	Jul 18, 2024	AttributeDescriptive	—Unverified
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion	Jul 15, 2024	image-classificationImage Classification	CodeCode Available
Semantic Compositions Enhance Vision-Language Contrastive Learning	Jul 1, 2024	ClassificationContrastive Learning	—Unverified
BaFTA: Backprop-Free Test-Time Adaptation For Zero-Shot Vision-Language Models	Jun 17, 2024	image-classificationImage Classification	—Unverified
Multimodal Adversarial Defense for Vision-Language Models by Leveraging One-To-Many Relationships	May 29, 2024	Adversarial DefenseAdversarial Robustness	—Unverified
It's Not a Modality Gap: Characterizing and Addressing the Contrastive Gap	May 28, 2024	image-classificationImage Classification	—Unverified
What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models	May 24, 2024	Classificationimage-classification	CodeCode Available
Who's in and who's out? A case study of multimodal CLIP-filtering in DataComp	May 13, 2024	image-classificationImage Classification	CodeCode Available
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified
MoDE: CLIP Data Experts via Clustering	Apr 24, 2024	Clusteringimage-classification	CodeCode Available
A Progressive Framework of Vision-language Knowledge Distillation and Alignment for Multilingual Scene	Apr 17, 2024	image-classificationImage Classification	—Unverified
Bridge the Modality and Capability Gaps in Vision-Language Model Selection	Mar 20, 2024	Capacity Estimationimage-classification	—Unverified
Exploring Low-Resource Medical Image Classification with Weakly Supervised Prompt Learning	Feb 6, 2024	Few-Shot Learningimage-classification	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

All datasets Country211 ICinW ODinW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OpenClip H/14 (34B)(Laion2B)	Top-1 accuracy	30.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP (ViT B-32)	Average Score	56.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIP (Tiny A)	Average Score	11.4	—	Unverified