Zero-Shot Learning

Zero-shot learning (ZSL) is a model's ability to detect classes never seen during training. The condition is that the classes are not known during supervised learning.

Earlier work in zero-shot learning use attributes in a two-step approach to infer unknown classes. In the computer vision context, more recent advances learn mappings from image feature space to semantic space. Other approaches learn non-linear multimodal embeddings. In the modern NLP context, language models can be evaluated on downstream tasks without fine tuning.

Benchmark datasets for zero-shot learning include aPY, AwA, and CUB, among others.

( Image credit: Prototypical Networks for Few shot Learning in PyTorch )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1864 papers

Title	Date	Tasks	Status
Explain via Any Concept: Concept Bottleneck Model with Open Vocabulary Concepts	Aug 5, 2024	zero-shot-classificationZero-Shot Learning	—Unverified
Evaluating Vision-Language Models for Zero-Shot Detection, Classification, and Association of Motorcycles, Passengers, and Helmets	Aug 5, 2024	Zero-Shot Learning	—Unverified
Do Large Language Models Speak All Languages Equally? A Comparative Study in Low-Resource Settings	Aug 5, 2024	AllBinary Classification	—Unverified
Geometric Algebra Meets Large Language Models: Instruction-Based Transformations of Separate Meshes in 3D, Interactive and Controllable Scenes	Aug 5, 2024	3D scene EditingZero-Shot Learning	—Unverified
AdaCBM: An Adaptive Concept Bottleneck Model for Explainable and Accurate Diagnosis	Aug 4, 2024	ClassificationDiagnostic	CodeCode Available
Out-Of-Distribution Detection for Audio-visual Generalized Zero-Shot Learning: A General Framework	Aug 2, 2024	Generalized Zero-Shot LearningOut-of-Distribution Detection	CodeCode Available
EZSR: Event-based Zero-Shot Recognition	Jul 31, 2024	ObjectObject Recognition	—Unverified
Prompting Encoder Models for Zero-Shot Classification: A Cross-Domain Study in Italian	Jul 30, 2024	Document ClassificationEntity Typing	—Unverified
Generative Diffusion Model Bootstraps Zero-shot Classification of Fetal Ultrasound Images In Underrepresented African Populations	Jul 29, 2024	zero-shot-classificationZero-Shot Learning	CodeCode Available
I can listen but cannot read: An evaluation of two-tower multimodal systems for instrument recognition	Jul 25, 2024	Instrument RecognitionRetrieval	CodeCode Available
Visual-Semantic Decomposition and Partial Alignment for Document-based Zero-Shot Learning	Jul 22, 2024	DiversityZero-Shot Learning	CodeCode Available
Rethinking Domain Adaptation and Generalization in the Era of CLIP	Jul 21, 2024	Domain AdaptationZero-Shot Learning	—Unverified
Multi-modal Relation Distillation for Unified 3D Representation Learning	Jul 19, 2024	RelationRepresentation Learning	—Unverified
Zero-Shot Underwater Gesture Recognition	Jul 19, 2024	Generative Adversarial NetworkGesture Recognition	CodeCode Available
An Application of Large Language Models to Coding Negotiation Transcripts	Jul 18, 2024	In-Context LearningZero-Shot Learning	—Unverified
Audio-visual Generalized Zero-shot Learning the Easy Way	Jul 18, 2024	Generalized Zero-Shot LearningZero-Shot Learning	—Unverified
Attention Based Simple Primitives for Open World Compositional Zero-Shot Learning	Jul 18, 2024	AttributeCompositional Zero-Shot Learning	CodeCode Available
Compound Expression Recognition via Multi Model Ensemble for the ABAW7 Challenge	Jul 17, 2024	Ensemble LearningZero-Shot Learning	—Unverified
ModalChorus: Visual Probing and Alignment of Multi-modal Embeddings via Modal Fusion Map	Jul 17, 2024	Cross-Modal RetrievalDimensionality Reduction	CodeCode Available
Codebook LLMs: Evaluating LLMs as Measurement Tools for Political Science Concepts	Jul 15, 2024	Zero-Shot Learning	—Unverified
Anticipating Future Object Compositions without Forgetting	Jul 15, 2024	AttributeCompositional Zero-Shot Learning	—Unverified
Dense Multimodal Alignment for Open-Vocabulary 3D Scene Understanding	Jul 13, 2024	Scene UnderstandingZero-Shot Learning	—Unverified
PFPs: Prompt-guided Flexible Pathological Segmentation for Diverse Potential Outcomes Using Large Vision and Language Models	Jul 13, 2024	Language ModelingLanguage Modelling	—Unverified
Spiking Tucker Fusion Transformer for Audio-Visual Zero-Shot Learning	Jul 11, 2024	Temporal SequencesZero-Shot Learning	—Unverified
CosmoCLIP: Generalizing Large Vision-Language Models for Astronomical Imaging	Jul 10, 2024	Contrastive LearningImage-text Retrieval	—Unverified
Malicious Path Manipulations via Exploitation of Representation Vulnerabilities of Vision-Language Navigation Systems	Jul 10, 2024	Language ModelingLanguage Modelling	—Unverified
Towards a text-based quantitative and explainable histopathology image analysis	Jul 10, 2024	image-classificationImage Classification	CodeCode Available
DuInNet: Dual-Modality Feature Interaction for Point Cloud Completion	Jul 10, 2024	DenoisingPoint Cloud Completion	—Unverified
Pseudo-triplet Guided Few-shot Composed Image Retrieval	Jul 8, 2024	Active LearningImage Retrieval	—Unverified
Semantic Compositions Enhance Vision-Language Contrastive Learning	Jul 1, 2024	ClassificationContrastive Learning	—Unverified
At First Sight: Zero-Shot Classification of Astronomical Images with Large Multimodal Models	Jun 24, 2024	AstronomyClassification	—Unverified
Evaluation of Language Models in the Medical Context Under Resource-Constrained Settings	Jun 24, 2024	Conditional Text GenerationLanguage Modelling	CodeCode Available
Review of Zero-Shot and Few-Shot AI Algorithms in The Medical Domain	Jun 23, 2024	Few-Shot Learningobject-detection	—Unverified
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation	Jun 23, 2024	Representation Learningzero-shot-classification	—Unverified
Serial Position Effects of Large Language Models	Jun 23, 2024	PositionZero-Shot Learning	—Unverified
Contextual Interaction via Primitive-based Adversarial Training For Compositional Zero-shot Learning	Jun 21, 2024	AttributeCompositional Zero-Shot Learning	CodeCode Available
CLIP-Decoder : ZeroShot Multilabel Classification using Multimodal CLIP Aligned Representation	Jun 21, 2024	ClassificationDecoder	CodeCode Available
A Data-Driven Guided Decoding Mechanism for Diagnostic Captioning	Jun 20, 2024	DiagnosticImage to text	CodeCode Available
Factual Dialogue Summarization via Learning from Large Language Models	Jun 20, 2024	Contrastive LearningData Augmentation	—Unverified
Using Multimodal Large Language Models for Automated Detection of Traffic Safety Critical Events	Jun 19, 2024	Few-Shot LearningZero-Shot Learning	—Unverified
FuseGen: PLM Fusion for Data-generation based Zero-shot Learning	Jun 18, 2024	Zero-Shot Learning	CodeCode Available
MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning	Jun 18, 2024	AttributeCompositional Zero-Shot Learning	—Unverified
BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM	Jun 17, 2024	Continual Pretrainingzero-shot-classification	—Unverified
Zero-Shot Learning Over Large Output Spaces : Utilizing Indirect Knowledge Extraction from Large Language Models	Jun 13, 2024	Language ModellingLarge Language Model	—Unverified
Understanding Visual Concepts Across Models	Jun 11, 2024	Image Generationobject-detection	CodeCode Available
BAMO at SemEval-2024 Task 9: BRAINTEASER: A Novel Task Defying Common Sense	Jun 7, 2024	Common Sense ReasoningSentence	CodeCode Available
Attend and Enrich: Enhanced Visual Prompt for Zero-Shot Learning	Jun 5, 2024	AttributeDomain Generalization	—Unverified
Exploring Data Efficiency in Zero-Shot Learning with Diffusion Models	Jun 5, 2024	Generalized Zero-Shot LearningZero-Shot Learning	—Unverified
SLANT: Spurious Logo ANalysis Toolkit	Jun 3, 2024	zero-shot-classificationZero-Shot Learning	—Unverified
Multi-Modal Generative Embedding Model	May 29, 2024	Caption GenerationCross-Modal Retrieval	—Unverified

Show:10 25 50

← PrevPage 15 of 38Next →

All datasets CUB-200-2011 MedConceptsQA SUN Attribute AwA2 Caltech-101 CIFAR-10 CIFAR-100 COCO-MLT DTD FGVC-Aircraft Flowers-102 Food-101

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	87.5	—	Unverified
2	DUET	average top-1 classification accuracy	72.3	—	Unverified
3	Composer	average top-1 classification accuracy	69.4	—	Unverified
4	HDC-ZSC-MLP	average top-1 classification accuracy	65.6	—	Unverified
5	ZSL_TF-VAEGAN	average top-1 classification accuracy	64.9	—	Unverified
6	ZLaP	Accuracy	64.3	—	Unverified
7	ZLaP*	Accuracy	64.2	—	Unverified
8	HDC-ZSC	average top-1 classification accuracy	63.8	—	Unverified
9	SPOT	average top-1 classification accuracy	62.9	—	Unverified
10	f-VAEGAN-D2	average top-1 classification accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dmis-lab/biobert-v1.1	Accuracy	26.15	—	Unverified
2	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.84	—	Unverified
3	epfl-llm/meditron-7b	Accuracy	25.75	—	Unverified
4	dmis-lab/meerkat-7b-v1.0	Accuracy	25.68	—	Unverified
5	meta-llama/Meta-Llama-3-8B-Instruct	Accuracy	25.65	—	Unverified
6	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.54	—	Unverified
7	dmis-lab/biobert-v1.1	Accuracy	25.46	—	Unverified
8	epfl-llm/meditron-70b	Accuracy	25.36	—	Unverified
9	epfl-llm/meditron-70b	Accuracy	25.26	—	Unverified
10	HuggingFaceH4/zephyr-7b-beta	Accuracy	25.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	77.3	—	Unverified
2	SPOT (VAEGAN)	average top-1 classification accuracy	66.04	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	66	—	Unverified
4	f-VAEGAN	average top-1 classification accuracy	64.7	—	Unverified
5	DUET (Ours)	average top-1 classification accuracy	64.4	—	Unverified
6	LisGAN	average top-1 classification accuracy	61.7	—	Unverified
7	TCN	average top-1 classification accuracy	61.5	—	Unverified
8	f-CLSWGAN	average top-1 classification accuracy	60.8	—	Unverified
9	Cycle-WGAN	average top-1 classification accuracy	59.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZeroDiff	average top-1 classification accuracy	86.4	—	Unverified
2	ZSL-KG	average top-1 classification accuracy	78.08	—	Unverified
3	ZSL_TF-VAEGAN	average top-1 classification accuracy	72.2	—	Unverified
4	DUET (Ours)	average top-1 classification accuracy	69.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	84	—	Unverified
2	ZLaP*	Accuracy	83.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	93.6	—	Unverified
2	ZLaP	Accuracy	93.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	74.2	—	Unverified
2	ZLaP	Accuracy	74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViT-B/16	Average mAP	60.17	—	Unverified
2	ResNet-50	Average mAP	56.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	51.2	—	Unverified
2	ZLaP*	Accuracy	51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	29.1	—	Unverified
2	ZLaP*	Accuracy	29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	75.9	—	Unverified
2	ZLaP*	Accuracy	75.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	87.9	—	Unverified
2	ZLaP	Accuracy	87.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Top 1 Accuracy	72.1	—	Unverified
2	ZLaP*	Top 1 Accuracy	72.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	21.7	—	Unverified
2	HiTeA	Accuracy	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HiTeA	Accuracy	37.4	—	Unverified
2	HiTeA	Accuracy	0.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPOT	average top-1 classification accuracy	71.9	—	Unverified
2	ZSL_TF-VAEGAN	average top-1 classification accuracy	70.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP	Accuracy	90	—	Unverified
2	ZLaP*	Accuracy	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.8	—	Unverified
2	ZLaP	Accuracy	71.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	71.4	—	Unverified
2	ZLaP	Accuracy	71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	76.3	—	Unverified
2	ZLaP	Accuracy	76.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP(ViT-B/16)	Average mAP	85.77	—	Unverified
2	CLIP(ResNet-50)	Average mAP	84.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Top-1	60.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	zsl_ADA	Average Per-Class Accuracy	70.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZLaP*	Accuracy	63.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSDA	Pearson correlation coefficient (PCC)	0.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeViLA	Accuracy	72.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	M^2-Encoder	Accuracy	80.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FrozenBiLM	Accuracy	51.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CZSL	A-acc	36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZS3Net	k=10 mIOU	26.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZSL-KG	Accuracy	88.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoChat2	Accuracy	40.6	—	Unverified