Zero-Shot Learning

Zero-shot learning (ZSL) is a model's ability to detect classes never seen during training. The condition is that the classes are not known during supervised learning.

Earlier work in zero-shot learning use attributes in a two-step approach to infer unknown classes. In the computer vision context, more recent advances learn mappings from image feature space to semantic space. Other approaches learn non-linear multimodal embeddings. In the modern NLP context, language models can be evaluated on downstream tasks without fine tuning.

Benchmark datasets for zero-shot learning include aPY, AwA, and CUB, among others.

( Image credit: Prototypical Networks for Few shot Learning in PyTorch )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1864 papers

Title	Date	Tasks	Status	Hype
Learning Adversarial Semantic Embeddings for Zero-Shot Recognition in Open Worlds	Jul 7, 2023	Open Set LearningZero-Shot Learning	CodeCode Available	1
Distilling Large Vision-Language Model with Out-of-Distribution Generalizability	Jul 6, 2023	Few-Shot Image ClassificationImage Classification	CodeCode Available	1
The mapKurator System: A Complete Pipeline for Extracting and Linking Text from Historical Maps	Jun 29, 2023	Zero-Shot Learning	CodeCode Available	1
Enlighten Anything: When Segment Anything Model Meets Low-Light Image Enhancement	Jun 17, 2023	Image EnhancementImage Restoration	CodeCode Available	1
Enhancing CLIP with CLIP: Exploring Pseudolabeling for Limited-Label Prompt Tuning	Jun 2, 2023	image-classificationImage Classification	CodeCode Available	1
Layout and Task Aware Instruction Prompt for Zero-shot Document Image Question Answering	Jun 1, 2023	Optical Character Recognition (OCR)Question Answering	CodeCode Available	1
UCAS-IIE-NLP at SemEval-2023 Task 12: Enhancing Generalization of Multilingual BERT for Low-resource Sentiment Analysis	Jun 1, 2023	Contrastive LearningRepresentation Learning	CodeCode Available	1
FaceDNeRF: Semantics-Driven Face Reconstruction, Prompt Editing and Relighting with Diffusion Models	Jun 1, 2023	3D Face ReconstructionFace Reconstruction	CodeCode Available	1
Learning Conditional Attributes for Compositional Zero-Shot Learning	May 29, 2023	AttributeCompositional Zero-Shot Learning	CodeCode Available	1
Improved Probabilistic Image-Text Representations	May 29, 2023	Data AugmentationImage-text matching	CodeCode Available	1
Test-Time Adaptation with CLIP Reward for Zero-Shot Generalization in Vision-Language Models	May 29, 2023	Image CaptioningImage Classification	CodeCode Available	1
GIMLET: A Unified Graph-Text Model for Instruction-Based Molecule Zero-Shot Learning	May 28, 2023	Property PredictionZero-Shot Learning	CodeCode Available	1
CAILA: Concept-Aware Intra-Layer Adapters for Compositional Zero-Shot Learning	May 26, 2023	AttributeCompositional Zero-Shot Learning	CodeCode Available	1
Multilingual Text-to-Speech Synthesis for Turkic Languages Using Transliteration	May 25, 2023	Speech Synthesistext-to-speech	CodeCode Available	1
Parts of Speech-Grounded Subspaces in Vision-Language Models	May 23, 2023	Image GenerationPOS	CodeCode Available	1
S-CLIP: Semi-supervised Vision-Language Learning using Few Specialist Captions	May 23, 2023	Contrastive LearningImage-text Retrieval	CodeCode Available	1
Prompting Language-Informed Distribution for Compositional Zero-Shot Learning	May 23, 2023	Compositional Zero-Shot LearningInformativeness	CodeCode Available	1
ReGen: Zero-Shot Text Classification via Training Data Generation with Progressive Dense Retrieval	May 18, 2023	DescriptiveRetrieval	CodeCode Available	1
MedBLIP: Bootstrapping Language-Image Pre-training from 3D Medical Images and Texts	May 18, 2023	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	1
Dual Intent Enhanced Graph Neural Network for Session-based New Item Recommendation	May 10, 2023	Decision MakingGraph Neural Network	CodeCode Available	1
Stance Detection: A Practical Guide to Classifying Political Beliefs in Text	May 2, 2023	In-Context LearningNatural Language Inference	CodeCode Available	1
Self-similarity-based super-resolution of photoacoustic angiography from hand-drawn doodles	May 2, 2023	Deep LearningImage Generation	CodeCode Available	1
Unicorn: A Unified Multi-tasking Model for Supporting Matching Tasks in Data Integration	May 1, 2023	Data IntegrationEntity Resolution	CodeCode Available	1
The Parrot Dilemma: Human-Labeled vs. LLM-augmented Data in Classification Tasks	Apr 26, 2023	Data AugmentationLanguage Modelling	CodeCode Available	1
Generation-driven Contrastive Self-training for Zero-shot Text Classification with Instruction-following LLM	Apr 24, 2023	Instruction FollowingLanguage Modelling	CodeCode Available	1
Segment Anything Model for Medical Image Analysis: an Experimental Study	Apr 20, 2023	Image SegmentationInteractive Segmentation	CodeCode Available	1
Text2Seg: Remote Sensing Image Semantic Segmentation via Text-Guided Visual Foundation Models	Apr 20, 2023	Instance SegmentationSegmentation	CodeCode Available	1
TagCLIP: Improving Discrimination Ability of Open-Vocabulary Semantic Segmentation	Apr 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
SemEval-2023 Task 12: Sentiment Analysis for African Languages (AfriSenti-SemEval)	Apr 13, 2023	ClassificationSentiment Analysis	CodeCode Available	1
A Closer Look at the Explainability of Contrastive Language-Image Pre-training	Apr 12, 2023	Interactive SegmentationLanguage Modelling	CodeCode Available	1
Interaction-Aware Prompting for Zero-Shot Spatio-Temporal Action Detection	Apr 10, 2023	Action DetectionLanguage Modeling	CodeCode Available	1
Zero-shot Medical Image Translation via Frequency-Guided Diffusion Models	Apr 5, 2023	AnatomySSIM	CodeCode Available	1
Exploring Vision-Language Models for Imbalanced Learning	Apr 4, 2023	Decoderzero-shot-classification	CodeCode Available	1
AutoLabel: CLIP-based framework for Open-set Video Domain Adaptation	Apr 3, 2023	Action RecognitionDomain Adaptation	CodeCode Available	1
Learning Attention as Disentangler for Compositional Zero-shot Learning	Mar 27, 2023	AttributeCompositional Zero-Shot Learning	CodeCode Available	1
Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention	Mar 27, 2023	DecoderGaze Prediction	CodeCode Available	1
Troika: Multi-Path Cross-Modal Traction for Compositional Zero-Shot Learning	Mar 27, 2023	Compositional Zero-Shot LearningObject	CodeCode Available	1
Progressive Semantic-Visual Mutual Adaption for Generalized Zero-Shot Learning	Mar 27, 2023	AttributeDecoder	CodeCode Available	1
The effectiveness of MAE pre-pretraining for billion-scale pretraining	Mar 23, 2023	Action ClassificationAction Recognition	CodeCode Available	1
MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language Knowledge	Mar 15, 2023	Action RecognitionFew-Shot action recognition	CodeCode Available	1
Bi-directional Distribution Alignment for Transductive Zero-Shot Learning	Mar 15, 2023	Zero-Shot Learning	CodeCode Available	1
Robust Contrastive Language-Image Pre-training against Data Poisoning and Backdoor Attacks	Mar 13, 2023	Backdoor AttackData Poisoning	CodeCode Available	1
ZeroNLG: Aligning and Autoencoding Domains for Zero-Shot Multimodal and Multilingual Natural Language Generation	Mar 11, 2023	Image CaptioningImage to text	CodeCode Available	1
Teaching CLIP to Count to Ten	Feb 23, 2023	counterfactualImage Generation	CodeCode Available	1
Text Classification in the Wild: a Large-scale Long-tailed Name Normalization Dataset	Feb 19, 2023	Long-tail Learningopen-set classification	CodeCode Available	1
A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity	Feb 8, 2023	Code GenerationHallucination	CodeCode Available	1
Diversity is Definitely Needed: Improving Model-Agnostic Zero-shot Classification via Stable Diffusion	Feb 7, 2023	ClassificationDiversity	CodeCode Available	1
CHiLS: Zero-Shot Image Classification with Hierarchical Label Sets	Feb 6, 2023	Classificationimage-classification	CodeCode Available	1
Open-VCLIP: Transforming CLIP to an Open-vocabulary Video Model via Interpolated Weight Optimization	Feb 1, 2023	Action RecognitionContinual Learning	CodeCode Available	1
Learning Customized Visual Models with Retrieval-Augmented Knowledge	Jan 17, 2023	Contrastive LearningRetrieval	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 38Next →

All datasets CUB-200-2011 MedConceptsQA SUN Attribute AwA2 Caltech-101 CIFAR-10 CIFAR-100 COCO-MLT DTD FGVC-Aircraft Flowers-102 Food-101

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	87.5	—	Unverified
2	DUET	average top-1 classification accuracy	72.3	—	Unverified
3	Composer	average top-1 classification accuracy	69.4	—	Unverified
4	HDC-ZSC-MLP	average top-1 classification accuracy	65.6	—	Unverified
5	ZSL_TF-VAEGAN	average top-1 classification accuracy	64.9	—	Unverified
6	ZLaP	Accuracy	64.3	—	Unverified
7	ZLaP*	Accuracy	64.2	—	Unverified
8	HDC-ZSC	average top-1 classification accuracy	63.8	—	Unverified
9	SPOT	average top-1 classification accuracy	62.9	—	Unverified
10	f-VAEGAN-D2	average top-1 classification accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dmis-lab/biobert-v1.1	Accuracy	26.15	—	Unverified
2	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.84	—	Unverified
3	epfl-llm/meditron-7b	Accuracy	25.75	—	Unverified
4	dmis-lab/meerkat-7b-v1.0	Accuracy	25.68	—	Unverified
5	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.65	—	Unverified
6	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.54	—	Unverified
7	dmis-lab/biobert-v1.1	Accuracy	25.46	—	Unverified
8	epfl-llm/meditron-70b	Accuracy	25.36	—	Unverified
9	epfl-llm/meditron-70b	Accuracy	25.26	—	Unverified
10	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	77.3	—	Unverified
2	SPOT (VAEGAN)	average top-1 classification accuracy	66.04	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	66	—	Unverified
4	f-VAEGAN	average top-1 classification accuracy	64.7	—	Unverified
5	DUET (Ours)	average top-1 classification accuracy	64.4	—	Unverified
6	LisGAN	average top-1 classification accuracy	61.7	—	Unverified
7	TCN	average top-1 classification accuracy	61.5	—	Unverified
8	f-CLSWGAN	average top-1 classification accuracy	60.8	—	Unverified
9	Cycle-WGAN	average top-1 classification accuracy	59.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	86.4	—	Unverified
2	ZSL-KG	average top-1 classification accuracy	78.08	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	72.2	—	Unverified
4	DUET (Ours)	average top-1 classification accuracy	69.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	84	—	Unverified
2	ZLaP*	Accuracy	83.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	93.6	—	Unverified
2	ZLaP	Accuracy	93.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	74.2	—	Unverified
2	ZLaP	Accuracy	74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViT-B/16	Average mAP	60.17	—	Unverified
2	ResNet-50	Average mAP	56.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	51.2	—	Unverified
2	ZLaP*	Accuracy	51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	29.1	—	Unverified
2	ZLaP*	Accuracy	29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	75.9	—	Unverified
2	ZLaP*	Accuracy	75.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	87.9	—	Unverified
2	ZLaP	Accuracy	87.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Top 1 Accuracy	72.1	—	Unverified
2	ZLaP*	Top 1 Accuracy	72.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	21.7	—	Unverified
2	HiTeA	Accuracy	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	37.4	—	Unverified
2	HiTeA	Accuracy	0.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPOT	average top-1 classification accuracy	71.9	—	Unverified
2	ZSL_TF-VAEGAN	average top-1 classification accuracy	70.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	90	—	Unverified
2	ZLaP*	Accuracy	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.8	—	Unverified
2	ZLaP	Accuracy	71.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.4	—	Unverified
2	ZLaP	Accuracy	71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	76.3	—	Unverified
2	ZLaP	Accuracy	76.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP(ViT-B/16)	Average mAP	85.77	—	Unverified
2	CLIP(ResNet-50)	Average mAP	84.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Top-1	60.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	zsl_ADA	Average Per-Class Accuracy	70.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	63.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSDA	Pearson correlation coefficient (PCC)	0.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeViLA	Accuracy	72.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	M^2-Encoder	Accuracy	80.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FrozenBiLM	Accuracy	51.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CZSL	A-acc	36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZS3Net	k=10 mIOU	26.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Accuracy	88.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoChat2	Accuracy	40.6	—	Unverified