Zero-Shot Action Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 83 papers

Title	Date	Tasks	Status
The Role of Video Generation in Enhancing Data-Limited Action Understanding	May 26, 2025	Action RecognitionAction Understanding	—Unverified
Towards Universal Representation for Unseen Action Recognition	Mar 22, 2018	Action RecognitionMultiple Instance Learning	—Unverified
Transductive Universal Transport for Zero-Shot Action Recognition	Sep 29, 2021	Action RecognitionObject	—Unverified
Transductive Zero-Shot Action Recognition by Word-Vector Embedding	Nov 13, 2015	Action RecognitionAttribute	—Unverified
Universal Prototype Transport for Zero-Shot Action Recognition and Localization	Mar 8, 2022	Action RecognitionObject	—Unverified
VicTR: Video-conditioned Text Representations for Activity Recognition	Apr 5, 2023	Action ClassificationActivity Recognition	—Unverified
VideoCoCa: Video-Text Modeling with Zero-Shot Transfer from Contrastive Captioners	Dec 9, 2022	Question AnsweringRetrieval	—Unverified
Zero-Shot Action Recognition in Surveillance Videos	Oct 28, 2024	Action RecognitionVideo Understanding	—Unverified
Zero-Shot Action Recognition in Videos: A Survey	Sep 13, 2019	Action RecognitionAction Recognition In Still Images	—Unverified
Zero-Shot Action Recognition With Error-Correcting Output Codes	Jul 1, 2017	Action RecognitionTemporal Action Localization	—Unverified
Multimodal Open-Vocabulary Video Classification via Pre-Trained Vision and Language Models	Jul 15, 2022	Optical Flow EstimationVideo Classification	—Unverified
Multi-Task Zero-Shot Action Recognition with Prioritised Data Augmentation	Nov 26, 2016	Action RecognitionData Augmentation	—Unverified
Natural Language Descriptions for Human Activities in Video Streams	Sep 1, 2017	Action RecognitionLanguage Modeling	—Unverified
Objects2action: Classifying and localizing actions without any video example	Oct 23, 2015	AttributeObject	—Unverified
Reformulating Zero-shot Action Recognition for Multi-label Actions	Dec 1, 2021	Action ClassificationAction Detection	—Unverified
REST: REtrieve & Self-Train for generative action recognition	Sep 29, 2022	Action RecognitionCaption Generation	—Unverified
Semantic Embedding Space for Zero-Shot Action Recognition	Feb 5, 2015	Action RecognitionAttribute	—Unverified
LoCATe-GAT: Modeling Multi-Scale Local Context and Action Relationships for Zero-Shot Action Recognition	Nov 27, 2024	Action RecognitionGraph Attention	CodeCode Available
Learning a Deep Embedding Model for Zero-Shot Learning	Nov 15, 2016	Image CaptioningSentence	CodeCode Available
Zero-Shot Action Recognition from Diverse Object-Scene Compositions	Oct 26, 2021	Action RecognitionObject	CodeCode Available
An embarrassingly simple approach to zero-shot learning	Jul 6, 2015	Domain AdaptationZero-Shot Action Recognition	CodeCode Available
End-to-End Semantic Video Transformer for Zero-Shot Action Recognition	Mar 10, 2022	Action RecognitionTemporal Action Localization	CodeCode Available
FitCLIP: Refining Large-Scale Pretrained Image-Text Models for Zero-Shot Video Understanding Tasks	Mar 24, 2022	Action RecognitionRetrieval	CodeCode Available
Orthogonal Temporal Interpolation for Zero-Shot Video Recognition	Aug 14, 2023	Video RecognitionZero-Shot Action Recognition	CodeCode Available
Label-Embedding for Image Classification	Mar 30, 2015	AttributeClassification	CodeCode Available

Show:10 25 50

← PrevPage 3 of 4Next →

All datasets UCF101 HMDB51 Kinetics Olympics ActivityNet Charades THUMOS' 14

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OTI(ViT-L/14)	Top-1 Accuracy	92.8	—	Unverified
2	IMP-MoE-L	Top-1 Accuracy	91.5	—	Unverified
3	MOV (ViT-L/14)	Top-1 Accuracy	87.1	—	Unverified
4	VideoCoCa	Top-1 Accuracy	86.6	—	Unverified
5	BIKE	Top-1 Accuracy	86.6	—	Unverified
6	Text4Vis	Top-1 Accuracy	85.8	—	Unverified
7	TC-CLIP	Top-1 Accuracy	85.4	—	Unverified
8	EVA-CLIP-E/14+	Top-1 Accuracy	83.1	—	Unverified
9	MOV (ViT-B/16)	Top-1 Accuracy	82.6	—	Unverified
10	OST	Top-1 Accuracy	79.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MOV (ViT-L/14)	Top-1 Accuracy	64.7	—	Unverified
2	OTI(ViT-L/14)	Top-1 Accuracy	64	—	Unverified
3	BIKE	Top-1 Accuracy	61.4	—	Unverified
4	MOV (ViT-B/16)	Top-1 Accuracy	60.8	—	Unverified
5	IMP-MoE-L	Top-1 Accuracy	59.1	—	Unverified
6	VideoCoCa	Top-1 Accuracy	58.7	—	Unverified
7	Text4Vis	Top-1 Accuracy	58.4	—	Unverified
8	TC-CLIP	Top-1 Accuracy	56	—	Unverified
9	OST	Top-1 Accuracy	55.9	—	Unverified
10	MAXI	Top-1 Accuracy	52.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TC-CLIP	Top-1 Accuracy	78.1	—	Unverified
2	IMP-MoE-L	Top-1 Accuracy	76.8	—	Unverified
3	OST	Top-1 Accuracy	75.1	—	Unverified
4	MAXI	Top-1 Accuracy	71.6	—	Unverified
5	OTI（ViT-L/14）	Top-1 Accuracy	70.6	—	Unverified
6	VideoCoCa	Top-1 Accuracy	70.1	—	Unverified
7	Text4Vis	Top-1 Accuracy	68.9	—	Unverified
8	BIKE	Top-1 Accuracy	68.5	—	Unverified
9	X-CLIP	Top-1 Accuracy	65.2	—	Unverified
10	LanguageBind	Top-1 Accuracy	64.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPOT	Top-1 Accuracy	68.7	—	Unverified
2	CLASTER	Top-1 Accuracy	68.4	—	Unverified
3	ER-ZSAR	Top-1 Accuracy	60.2	—	Unverified
4	ZSECOC	Top-1 Accuracy	59.8	—	Unverified
5	TS-GCN	Top-1 Accuracy	56.5	—	Unverified
6	SJE(Atrribute)	Top-1 Accuracy	47.5	—	Unverified
7	MTE	Top-1 Accuracy	44.3	—	Unverified
8	ESZSL	Top-1 Accuracy	39.6	—	Unverified
9	SJE(Word Embedding)	Top-1 Accuracy	28.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BIKE	Top-1 Accuracy	86.2	—	Unverified
2	Text4Vis	Top-1 Accuracy	84.6	—	Unverified
3	LoCATe-GAT	Top-1 Accuracy	73.8	—	Unverified
4	ResT	Top-1 Accuracy	32.5	—	Unverified
5	E2E	Top-1 Accuracy	26.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSQNet	mAP	35.59	—	Unverified
2	VideoCoCa	mAP	25.8	—	Unverified
3	MAXI	mAP	23.8	—	Unverified
4	CLIP-Hitchhiker (ViT-B/16, 32 frames)	mAP	21.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSQNet	Accuracy	75.33	—	Unverified