Zero-Shot Learning

Zero-shot learning (ZSL) is a model's ability to detect classes never seen during training. The condition is that the classes are not known during supervised learning.

Earlier work in zero-shot learning use attributes in a two-step approach to infer unknown classes. In the computer vision context, more recent advances learn mappings from image feature space to semantic space. Other approaches learn non-linear multimodal embeddings. In the modern NLP context, language models can be evaluated on downstream tasks without fine tuning.

Benchmark datasets for zero-shot learning include aPY, AwA, and CUB, among others.

( Image credit: Prototypical Networks for Few shot Learning in PyTorch )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1864 papers

Title	Date	Tasks	Status	Hype
CARL-GT: Evaluating Causal Reasoning Capabilities of Large Language Models	Dec 23, 2024	Decision MakingMath	CodeCode Available	1
SenCLIP: Enhancing zero-shot land-use mapping for Sentinel-2 with ground-level prompting	Dec 11, 2024	zero-shot-classificationZero-Shot Learning	CodeCode Available	1
KNN-MMD: Cross Domain Wireless Sensing via Local Distribution Alignment	Dec 6, 2024	Action ClassificationAction Classification (1-shot)	CodeCode Available	1
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1
CLIP meets DINO for Tuning Zero-Shot Classifier using Unlabeled Image Collections	Nov 28, 2024	image-classificationImage Classification	CodeCode Available	1
TableTime: Reformulating Time Series Classification as Zero-Shot Table Understanding via Large Language Models	Nov 24, 2024	Problem DecompositionTime Series	CodeCode Available	1
CLIPer: Hierarchically Improving Spatial Representation of CLIP for Open-Vocabulary Semantic Segmentation	Nov 21, 2024	Open Vocabulary Semantic SegmentationOpen-Vocabulary Semantic Segmentation	CodeCode Available	1
Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning	Nov 18, 2024	AttributeCompositional Zero-Shot Learning	CodeCode Available	1
TDSM: Triplet Diffusion for Skeleton-Text Matching in Zero-Shot Action Recognition	Nov 16, 2024	Action RecognitionSkeleton Based Action Recognition	CodeCode Available	1
RaVL: Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models	Nov 6, 2024	image-classificationImage Classification	CodeCode Available	1
Abstracted Shapes as Tokens -- A Generalizable and Interpretable Model for Time-series Classification	Nov 1, 2024	QuantizationRepresentation Learning	CodeCode Available	1
Interpreting and Analysing CLIP's Zero-Shot Image Classification via Mutual Knowledge	Oct 16, 2024	Classificationimage-classification	CodeCode Available	1
AgriCLIP: Adapting CLIP for Agriculture and Livestock via Domain-Specialized Cross-Model Alignment	Oct 2, 2024	Self-Supervised Learningzero-shot-classification	CodeCode Available	1
For Overall Nighttime Visibility: Integrate Irregular Glow Removal With Glow-Aware Enhancement	Sep 23, 2024	Flare RemovalImage Enhancement	CodeCode Available	1
Enhancing Agricultural Environment Perception via Active Vision and Zero-Shot Learning	Sep 19, 2024	3D ReconstructionZero-Shot Learning	CodeCode Available	1
CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network	Aug 20, 2024	Action ClassificationAction Classification (1-shot)	CodeCode Available	1
DC3DO: Diffusion Classifier for 3D Objects	Aug 13, 2024	3D Object ClassificationClassification	CodeCode Available	1
OmniCLIP: Adapting CLIP for Video Recognition with Spatial-Temporal Omni-Scale Feature Learning	Aug 12, 2024	Video RecognitionZero-Shot Learning	CodeCode Available	1
Leveraging Foundation Models for Zero-Shot IoT Sensing	Jul 29, 2024	Data AugmentationGeneralized Zero-Shot Learning	CodeCode Available	1
Adversarial Robustification via Text-to-Image Diffusion Models	Jul 26, 2024	Adversarial Robustnesszero-shot-classification	CodeCode Available	1
ClinicRealm: Re-evaluating Large Language Models with Conventional Machine Learning for Non-Generative Clinical Prediction Tasks	Jul 26, 2024	BenchmarkingModel Selection	CodeCode Available	1
InvAgent: A Large Language Model based Multi-Agent System for Inventory Management in Supply Chains	Jul 16, 2024	Decision MakingLanguage Modeling	CodeCode Available	1
STD-PLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with PLM	Jul 12, 2024	Few-Shot LearningImputation	CodeCode Available	1
BioTrove: A Large Curated Image Dataset Enabling AI for Biodiversity	Jun 25, 2024	Zero-Shot Learning	CodeCode Available	1
Part-aware Unified Representation of Language and Skeleton for Zero-shot Action Recognition	Jun 19, 2024	Action RecognitionSkeleton Based Action Recognition	CodeCode Available	1
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity	Jun 18, 2024	Contrastive LearningLanguage Modelling	CodeCode Available	1
Fairer Preferences Elicit Improved Human-Aligned Large Language Model Judgments	Jun 17, 2024	FairnessLanguage Modeling	CodeCode Available	1
Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition	Jun 13, 2024	Retrievalzero-shot-classification	CodeCode Available	1
CPLIP: Zero-Shot Learning for Histopathology with Comprehensive Vision-Language Alignment	Jun 7, 2024	Contrastive LearningZero-Shot Learning	CodeCode Available	1
CountCLIP -- [Re] Teaching CLIP to Count to Ten	Jun 5, 2024	zero-shot-classificationZero-Shot Counting	CodeCode Available	1
CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale	May 27, 2024	Contrastive LearningZero-Shot Learning	CodeCode Available	1
Implicit In-context Learning	May 23, 2024	In-Context LearningTransfer Learning	CodeCode Available	1
Differentiable Model Scaling using Differentiable Topk	May 12, 2024	GPUimage-classification	CodeCode Available	1
MedConceptsQA: Open Source Medical Concepts QA Benchmark	May 12, 2024	Few-Shot LearningQuestion Answering	CodeCode Available	1
Pseudo-Prompt Generating in Pre-trained Vision-Language Models for Multi-Label Medical Image Classification	May 10, 2024	Decoderimage-classification	CodeCode Available	1
CLIPArTT: Adaptation of CLIP to New Domains at Test Time	May 1, 2024	Pseudo LabelTest-time Adaptation	CodeCode Available	1
Modeling Caption Diversity in Contrastive Vision-Language Pretraining	Apr 30, 2024	Diversityzero-shot-classification	CodeCode Available	1
AAPL: Adding Attributes to Prompt Learning for Vision-Language Models	Apr 25, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
OpenDlign: Open-World Point Cloud Understanding with Depth-Aligned Images	Apr 25, 2024	Representation LearningTransfer Learning	CodeCode Available	1
The Devil is in the Few Shots: Iterative Visual Knowledge Completion for Few-shot Learning	Apr 15, 2024	Few-Shot LearningZero-Shot Learning	CodeCode Available	1
Knowledge-enhanced Visual-Language Pretraining for Computational Pathology	Apr 15, 2024	Cross-Modal RetrievalLanguage Modeling	CodeCode Available	1
Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning	Apr 11, 2024	Zero-Shot Learning	CodeCode Available	1
Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models	Apr 9, 2024	Audio ClassificationGeneralized Zero-Shot Learning	CodeCode Available	1
Label Propagation for Zero-shot Classification with Vision-Language Models	Apr 5, 2024	ClassificationImage Classification	CodeCode Available	1
X-MIC: Cross-Modal Instance Conditioning for Egocentric Action Generalization	Mar 28, 2024	Video ClassificationZero-Shot Learning	CodeCode Available	1
VLM-CPL: Consensus Pseudo Labels from Vision-Language Models for Human Annotation-Free Pathological Image Classification	Mar 23, 2024	image-classificationImage Classification	CodeCode Available	1
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models	Mar 19, 2024	image-classificationImage Classification	CodeCode Available	1
CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation	Mar 19, 2024	DecoderInstance Segmentation	CodeCode Available	1
Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning	Mar 19, 2024	Diagnosticimage-classification	CodeCode Available	1
Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs	Mar 18, 2024	Language ModellingLarge Language Model	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 38Next →

All datasets CUB-200-2011 MedConceptsQA SUN Attribute AwA2 Caltech-101 CIFAR-10 CIFAR-100 COCO-MLT DTD FGVC-Aircraft Flowers-102 Food-101

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	87.5	—	Unverified
2	DUET	average top-1 classification accuracy	72.3	—	Unverified
3	Composer	average top-1 classification accuracy	69.4	—	Unverified
4	HDC-ZSC-MLP	average top-1 classification accuracy	65.6	—	Unverified
5	ZSL_TF-VAEGAN	average top-1 classification accuracy	64.9	—	Unverified
6	ZLaP	Accuracy	64.3	—	Unverified
7	ZLaP*	Accuracy	64.2	—	Unverified
8	HDC-ZSC	average top-1 classification accuracy	63.8	—	Unverified
9	SPOT	average top-1 classification accuracy	62.9	—	Unverified
10	f-VAEGAN-D2	average top-1 classification accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dmis-lab/biobert-v1.1	Accuracy	26.15	—	Unverified
2	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.84	—	Unverified
3	epfl-llm/meditron-7b	Accuracy	25.75	—	Unverified
4	dmis-lab/meerkat-7b-v1.0	Accuracy	25.68	—	Unverified
5	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.65	—	Unverified
6	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.54	—	Unverified
7	dmis-lab/biobert-v1.1	Accuracy	25.46	—	Unverified
8	epfl-llm/meditron-70b	Accuracy	25.36	—	Unverified
9	epfl-llm/meditron-70b	Accuracy	25.26	—	Unverified
10	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	77.3	—	Unverified
2	SPOT (VAEGAN)	average top-1 classification accuracy	66.04	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	66	—	Unverified
4	f-VAEGAN	average top-1 classification accuracy	64.7	—	Unverified
5	DUET (Ours)	average top-1 classification accuracy	64.4	—	Unverified
6	LisGAN	average top-1 classification accuracy	61.7	—	Unverified
7	TCN	average top-1 classification accuracy	61.5	—	Unverified
8	f-CLSWGAN	average top-1 classification accuracy	60.8	—	Unverified
9	Cycle-WGAN	average top-1 classification accuracy	59.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	86.4	—	Unverified
2	ZSL-KG	average top-1 classification accuracy	78.08	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	72.2	—	Unverified
4	DUET (Ours)	average top-1 classification accuracy	69.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	84	—	Unverified
2	ZLaP*	Accuracy	83.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	93.6	—	Unverified
2	ZLaP	Accuracy	93.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	74.2	—	Unverified
2	ZLaP	Accuracy	74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViT-B/16	Average mAP	60.17	—	Unverified
2	ResNet-50	Average mAP	56.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	51.2	—	Unverified
2	ZLaP*	Accuracy	51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	29.1	—	Unverified
2	ZLaP*	Accuracy	29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	75.9	—	Unverified
2	ZLaP*	Accuracy	75.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	87.9	—	Unverified
2	ZLaP	Accuracy	87.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Top 1 Accuracy	72.1	—	Unverified
2	ZLaP*	Top 1 Accuracy	72.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	21.7	—	Unverified
2	HiTeA	Accuracy	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	37.4	—	Unverified
2	HiTeA	Accuracy	0.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPOT	average top-1 classification accuracy	71.9	—	Unverified
2	ZSL_TF-VAEGAN	average top-1 classification accuracy	70.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	90	—	Unverified
2	ZLaP*	Accuracy	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.8	—	Unverified
2	ZLaP	Accuracy	71.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.4	—	Unverified
2	ZLaP	Accuracy	71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	76.3	—	Unverified
2	ZLaP	Accuracy	76.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP(ViT-B/16)	Average mAP	85.77	—	Unverified
2	CLIP(ResNet-50)	Average mAP	84.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Top-1	60.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	zsl_ADA	Average Per-Class Accuracy	70.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	63.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSDA	Pearson correlation coefficient (PCC)	0.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeViLA	Accuracy	72.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	M^2-Encoder	Accuracy	80.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FrozenBiLM	Accuracy	51.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CZSL	A-acc	36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZS3Net	k=10 mIOU	26.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Accuracy	88.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoChat2	Accuracy	40.6	—	Unverified