Zero-Shot Learning

Zero-shot learning (ZSL) is a model's ability to detect classes never seen during training. The condition is that the classes are not known during supervised learning.

Earlier work in zero-shot learning use attributes in a two-step approach to infer unknown classes. In the computer vision context, more recent advances learn mappings from image feature space to semantic space. Other approaches learn non-linear multimodal embeddings. In the modern NLP context, language models can be evaluated on downstream tasks without fine tuning.

Benchmark datasets for zero-shot learning include aPY, AwA, and CUB, among others.

( Image credit: Prototypical Networks for Few shot Learning in PyTorch )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 1864 papers

Title	Date	Tasks	Status	Hype
Connecting NeRFs, Images, and Text	Apr 11, 2024	NeRFRepresentation Learning	CodeCode Available	0
Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning	Apr 11, 2024	Zero-Shot Learning	CodeCode Available	1
Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation	Apr 9, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2
Anchor-based Robust Finetuning of Vision-Language Models	Apr 9, 2024	Language ModellingZero-Shot Learning	—Unverified	0
Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models	Apr 9, 2024	Audio ClassificationGeneralized Zero-Shot Learning	CodeCode Available	1
Condition Monitoring with Incomplete Data: An Integrated Variational Autoencoder and Distance Metric Framework	Apr 8, 2024	DescriptiveFault Detection	—Unverified	0
High-Discriminative Attribute Feature Learning for Generalized Zero-Shot Learning	Apr 7, 2024	AttributeGeneralized Zero-Shot Learning	—Unverified	0
Bootstrapping Chest CT Image Understanding by Distilling Knowledge from X-ray Expert Models	Apr 7, 2024	Contrastive LearningDiagnostic	—Unverified	0
Forget NLI, Use a Dictionary: Zero-Shot Topic Classification for Low-Resource Languages with Application to Luxembourgish	Apr 5, 2024	Language ModellingNatural Language Inference	CodeCode Available	0
Label Propagation for Zero-shot Classification with Vision-Language Models	Apr 5, 2024	ClassificationImage Classification	CodeCode Available	1
Towards Large Language Model driven Reference-less Translation Evaluation for English and Indian Languages	Apr 3, 2024	Language ModelingLanguage Modelling	—Unverified	0
Emergent Abilities in Reduced-Scale Generative Language Models	Apr 2, 2024	In-Context LearningZero-Shot Learning	CodeCode Available	0
Diffusion based Zero-shot Medical Image-to-Image Translation for Cross Modality Segmentation	Apr 1, 2024	Image SegmentationImage-to-Image Translation	—Unverified	0
Training-Free Semantic Segmentation via LLM-Supervision	Mar 31, 2024	Language ModelingLanguage Modelling	—Unverified	0
Small Language Models Learn Enhanced Reasoning Skills from Medical Textbooks	Mar 30, 2024	Few-Shot LearningInstruction Following	—Unverified	0
X-MIC: Cross-Modal Instance Conditioning for Egocentric Action Generalization	Mar 28, 2024	Video ClassificationZero-Shot Learning	CodeCode Available	1
VP3D: Unleashing 2D Visual Prompt for Text-to-3D Generation	Mar 25, 2024	3D GenerationNeRF	—Unverified	0
VLM-CPL: Consensus Pseudo Labels from Vision-Language Models for Human Annotation-Free Pathological Image Classification	Mar 23, 2024	image-classificationImage Classification	CodeCode Available	1
Comprehensive Evaluation and Insights into the Use of Large Language Models in the Automation of Behavior-Driven Development Acceptance Test Formulation	Mar 22, 2024	Few-Shot LearningIn-Context Learning	CodeCode Available	0
Long-CLIP: Unlocking the Long-Text Capability of CLIP	Mar 22, 2024	Image GenerationImage Retrieval	CodeCode Available	4
Less but Better: Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics	Mar 21, 2024	Generalized Zero-Shot LearningZero-Shot Learning	CodeCode Available	0
HierCode: A Lightweight Hierarchical Codebook for Zero-shot Chinese Text Recognition	Mar 20, 2024	Zero-Shot Learning	—Unverified	0
RAR: Retrieving And Ranking Augmented MLLMs for Visual Recognition	Mar 20, 2024	Contrastive LearningFine-Grained Visual Recognition	CodeCode Available	2
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models	Mar 19, 2024	image-classificationImage Classification	CodeCode Available	1
Audio-Visual Compound Expression Recognition Method based on Late Modality Fusion and Rule-based Decision	Mar 19, 2024	Cross-corpusEmotion Recognition	—Unverified	0
Entity6K: A Large Open-Domain Evaluation Dataset for Real-World Entity Recognition	Mar 19, 2024	Dense CaptioningImage Captioning	—Unverified	0
MEDBind: Unifying Language and Multimodal Medical Data Embeddings	Mar 19, 2024	Language ModelingLanguage Modelling	—Unverified	0
CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation	Mar 19, 2024	DecoderInstance Segmentation	CodeCode Available	1
UniBind: LLM-Augmented Unified and Balanced Representation Space to Bind Them All	Mar 19, 2024	AllContrastive Learning	—Unverified	0
Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning	Mar 19, 2024	Diagnosticimage-classification	CodeCode Available	1
Leveraging Large Language Models to Extract Information on Substance Use Disorder Severity from Clinical Notes: A Zero-shot Learning Approach	Mar 18, 2024	DiagnosticZero-Shot Learning	—Unverified	0
Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs	Mar 18, 2024	Language ModellingLarge Language Model	CodeCode Available	1
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters	Mar 18, 2024	Continual LearningIncremental Learning	CodeCode Available	3
CoLeCLIP: Open-Domain Continual Learning via Joint Task Prompt and Vocabulary Learning	Mar 15, 2024	class-incremental learningClass Incremental Learning	CodeCode Available	1
OpenGraph: Open-Vocabulary Hierarchical 3D Graph Representation in Large-Scale Outdoor Environments	Mar 14, 2024	Zero-Shot Learning	CodeCode Available	2
Select and Distill: Selective Dual-Teacher Knowledge Transfer for Continual Learning on Vision-Language Models	Mar 14, 2024	Continual LearningKnowledge Distillation	—Unverified	0
Sentinel-Guided Zero-Shot Learning: A Collaborative Paradigm without Real Data Exposure	Mar 14, 2024	Zero-Shot Learning	CodeCode Available	0
Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained Ship Classification	Mar 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Segmentation of Knee Bones for Osteoarthritis Assessment: A Comparative Analysis of Supervised, Few-Shot, and Zero-Shot Learning Approaches	Mar 13, 2024	Few-Shot LearningMorphological Analysis	—Unverified	0
MolBind: Multimodal Alignment of Language, Molecules, and Proteins	Mar 13, 2024	Contrastive LearningDrug Discovery	—Unverified	0
MoralBERT: A Fine-Tuned Language Model for Capturing Moral Values in Social Discussions	Mar 12, 2024	Domain AdaptationLanguage Modeling	CodeCode Available	1
MENTOR: Multilingual tExt detectioN TOward leaRning by analogy	Mar 12, 2024	Few-Shot LearningScene Text Detection	—Unverified	0
Towards Zero-shot Human-Object Interaction Detection via Vision-Language Integration	Mar 12, 2024	DecoderHuman-Object Interaction Detection	—Unverified	0
Improving deep learning with prior knowledge and cognitive models: A survey on enhancing explainability, adversarial robustness and zero-shot learning	Mar 11, 2024	Adversarial RobustnessDeep Learning	—Unverified	0
Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement	Mar 11, 2024	Clinical KnowledgeDescriptive	CodeCode Available	2
Split to Merge: Unifying Separated Modalities for Unsupervised Domain Adaptation	Mar 11, 2024	Domain AdaptationUnsupervised Domain Adaptation	CodeCode Available	1
Personalized LoRA for Human-Centered Text Understanding	Mar 10, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
CSCNET: Class-Specified Cascaded Network for Compositional Zero-Shot Learning	Mar 9, 2024	AttributeCompositional Zero-Shot Learning	—Unverified	0
MedFLIP: Medical Vision-and-Language Self-supervised Fast Pre-Training with Masked Autoencoder	Mar 7, 2024	Domain AdaptationMedical Image Analysis	—Unverified	0
ACC-ViT : Atrous Convolution's Comeback in Vision Transformers	Mar 7, 2024	Contrastive LearningMedical Image Analysis	—Unverified	0

Show:10 25 50

← PrevPage 10 of 38Next →

All datasets CUB-200-2011 MedConceptsQA SUN Attribute AwA2 Caltech-101 CIFAR-10 CIFAR-100 COCO-MLT DTD FGVC-Aircraft Flowers-102 Food-101

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	87.5	—	Unverified
2	DUET	average top-1 classification accuracy	72.3	—	Unverified
3	Composer	average top-1 classification accuracy	69.4	—	Unverified
4	HDC-ZSC-MLP	average top-1 classification accuracy	65.6	—	Unverified
5	ZSL_TF-VAEGAN	average top-1 classification accuracy	64.9	—	Unverified
6	ZLaP	Accuracy	64.3	—	Unverified
7	ZLaP*	Accuracy	64.2	—	Unverified
8	HDC-ZSC	average top-1 classification accuracy	63.8	—	Unverified
9	SPOT	average top-1 classification accuracy	62.9	—	Unverified
10	f-VAEGAN-D2	average top-1 classification accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dmis-lab/biobert-v1.1	Accuracy	26.15	—	Unverified
2	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.84	—	Unverified
3	epfl-llm/meditron-7b	Accuracy	25.75	—	Unverified
4	dmis-lab/meerkat-7b-v1.0	Accuracy	25.68	—	Unverified
5	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.65	—	Unverified
6	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.54	—	Unverified
7	dmis-lab/biobert-v1.1	Accuracy	25.46	—	Unverified
8	epfl-llm/meditron-70b	Accuracy	25.36	—	Unverified
9	epfl-llm/meditron-70b	Accuracy	25.26	—	Unverified
10	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	77.3	—	Unverified
2	SPOT (VAEGAN)	average top-1 classification accuracy	66.04	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	66	—	Unverified
4	f-VAEGAN	average top-1 classification accuracy	64.7	—	Unverified
5	DUET (Ours)	average top-1 classification accuracy	64.4	—	Unverified
6	LisGAN	average top-1 classification accuracy	61.7	—	Unverified
7	TCN	average top-1 classification accuracy	61.5	—	Unverified
8	f-CLSWGAN	average top-1 classification accuracy	60.8	—	Unverified
9	Cycle-WGAN	average top-1 classification accuracy	59.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	86.4	—	Unverified
2	ZSL-KG	average top-1 classification accuracy	78.08	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	72.2	—	Unverified
4	DUET (Ours)	average top-1 classification accuracy	69.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	84	—	Unverified
2	ZLaP*	Accuracy	83.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	93.6	—	Unverified
2	ZLaP	Accuracy	93.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	74.2	—	Unverified
2	ZLaP	Accuracy	74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViT-B/16	Average mAP	60.17	—	Unverified
2	ResNet-50	Average mAP	56.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	51.2	—	Unverified
2	ZLaP*	Accuracy	51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	29.1	—	Unverified
2	ZLaP*	Accuracy	29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	75.9	—	Unverified
2	ZLaP*	Accuracy	75.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	87.9	—	Unverified
2	ZLaP	Accuracy	87.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Top 1 Accuracy	72.1	—	Unverified
2	ZLaP*	Top 1 Accuracy	72.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	21.7	—	Unverified
2	HiTeA	Accuracy	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	37.4	—	Unverified
2	HiTeA	Accuracy	0.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPOT	average top-1 classification accuracy	71.9	—	Unverified
2	ZSL_TF-VAEGAN	average top-1 classification accuracy	70.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	90	—	Unverified
2	ZLaP*	Accuracy	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.8	—	Unverified
2	ZLaP	Accuracy	71.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.4	—	Unverified
2	ZLaP	Accuracy	71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	76.3	—	Unverified
2	ZLaP	Accuracy	76.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP(ViT-B/16)	Average mAP	85.77	—	Unverified
2	CLIP(ResNet-50)	Average mAP	84.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Top-1	60.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	zsl_ADA	Average Per-Class Accuracy	70.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	63.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSDA	Pearson correlation coefficient (PCC)	0.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeViLA	Accuracy	72.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	M^2-Encoder	Accuracy	80.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FrozenBiLM	Accuracy	51.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CZSL	A-acc	36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZS3Net	k=10 mIOU	26.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Accuracy	88.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoChat2	Accuracy	40.6	—	Unverified