SOTAVerified|Agents Browse Leaderboard About Blog

Zero-Shot Action Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 83 papers

Title	Date	Tasks	Status	Hype
The Role of Video Generation in Enhancing Data-Limited Action Understanding	May 26, 2025	Action RecognitionAction Understanding	—Unverified	0
Can masking background and object reduce static bias for zero-shot action recognition?	Jan 22, 2025	Action RecognitionZero-Shot Action Recognition	—Unverified	0
Semantic-guided Cross-Modal Prompt Learning for Skeleton-based Zero-shot Action Recognition	Jan 1, 2025	Action RecognitionComputational Efficiency	—Unverified	0
Building a Multi-modal Spatiotemporal Expert for Zero-shot Action Recognition with CLIP	Dec 13, 2024	Action RecognitionText Augmentation	CodeCode Available	1
LoCATe-GAT: Modeling Multi-Scale Local Context and Action Relationships for Zero-Shot Action Recognition	Nov 27, 2024	Action RecognitionGraph Attention	CodeCode Available	0
TDSM: Triplet Diffusion for Skeleton-Text Matching in Zero-Shot Action Recognition	Nov 16, 2024	Action RecognitionSkeleton Based Action Recognition	CodeCode Available	1
Zero-Shot Action Recognition in Surveillance Videos	Oct 28, 2024	Action RecognitionVideo Understanding	—Unverified	0
Continual Learning Improves Zero-Shot Action Recognition	Oct 14, 2024	Action RecognitionContinual Learning	—Unverified	0
Zero-Shot Skeleton-based Action Recognition with Dual Visual-Text Alignment	Sep 22, 2024	Action RecognitionMetric Learning	—Unverified	0
Text-Enhanced Zero-Shot Action Recognition: A training-free approach	Aug 29, 2024	Action RecognitionTemporal Action Localization	—Unverified	0

Show:10 25 50

← PrevPage 1 of 9Next →

All datasets UCF101 HMDB51 Kinetics Olympics ActivityNet Charades THUMOS' 14

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OTI(ViT-L/14)	Top-1 Accuracy	92.8	—	Unverified
2	IMP-MoE-L	Top-1 Accuracy	91.5	—	Unverified
3	MOV (ViT-L/14)	Top-1 Accuracy	87.1	—	Unverified
4	VideoCoCa	Top-1 Accuracy	86.6	—	Unverified
5	BIKE	Top-1 Accuracy	86.6	—	Unverified
6	Text4Vis	Top-1 Accuracy	85.8	—	Unverified
7	TC-CLIP	Top-1 Accuracy	85.4	—	Unverified
8	EVA-CLIP-E/14+	Top-1 Accuracy	83.1	—	Unverified
9	MOV (ViT-B/16)	Top-1 Accuracy	82.6	—	Unverified
10	OST	Top-1 Accuracy	79.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MOV (ViT-L/14)	Top-1 Accuracy	64.7	—	Unverified
2	OTI(ViT-L/14)	Top-1 Accuracy	64	—	Unverified
3	BIKE	Top-1 Accuracy	61.4	—	Unverified
4	MOV (ViT-B/16)	Top-1 Accuracy	60.8	—	Unverified
5	IMP-MoE-L	Top-1 Accuracy	59.1	—	Unverified
6	VideoCoCa	Top-1 Accuracy	58.7	—	Unverified
7	Text4Vis	Top-1 Accuracy	58.4	—	Unverified
8	TC-CLIP	Top-1 Accuracy	56	—	Unverified
9	OST	Top-1 Accuracy	55.9	—	Unverified
10	MAXI	Top-1 Accuracy	52.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TC-CLIP	Top-1 Accuracy	78.1	—	Unverified
2	IMP-MoE-L	Top-1 Accuracy	76.8	—	Unverified
3	OST	Top-1 Accuracy	75.1	—	Unverified
4	MAXI	Top-1 Accuracy	71.6	—	Unverified
5	OTI（ViT-L/14）	Top-1 Accuracy	70.6	—	Unverified
6	VideoCoCa	Top-1 Accuracy	70.1	—	Unverified
7	Text4Vis	Top-1 Accuracy	68.9	—	Unverified
8	BIKE	Top-1 Accuracy	68.5	—	Unverified
9	X-CLIP	Top-1 Accuracy	65.2	—	Unverified
10	LanguageBind	Top-1 Accuracy	64.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPOT	Top-1 Accuracy	68.7	—	Unverified
2	CLASTER	Top-1 Accuracy	68.4	—	Unverified
3	ER-ZSAR	Top-1 Accuracy	60.2	—	Unverified
4	ZSECOC	Top-1 Accuracy	59.8	—	Unverified
5	TS-GCN	Top-1 Accuracy	56.5	—	Unverified
6	SJE(Atrribute)	Top-1 Accuracy	47.5	—	Unverified
7	MTE	Top-1 Accuracy	44.3	—	Unverified
8	ESZSL	Top-1 Accuracy	39.6	—	Unverified
9	SJE(Word Embedding)	Top-1 Accuracy	28.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BIKE	Top-1 Accuracy	86.2	—	Unverified
2	Text4Vis	Top-1 Accuracy	84.6	—	Unverified
3	LoCATe-GAT	Top-1 Accuracy	73.8	—	Unverified
4	ResT	Top-1 Accuracy	32.5	—	Unverified
5	E2E	Top-1 Accuracy	26.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSQNet	mAP	35.59	—	Unverified
2	VideoCoCa	mAP	25.8	—	Unverified
3	MAXI	mAP	23.8	—	Unverified
4	CLIP-Hitchhiker (ViT-B/16, 32 frames)	mAP	21.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSQNet	Accuracy	75.33	—	Unverified