Action Recognition

Action Recognition is a computer vision task that involves recognizing human actions in videos or images. The goal is to classify and categorize the actions being performed in the video or image into a predefined set of action classes.

In the video domain, it is an open question whether training an action classification network on a sufficiently large dataset, will give a similar boost in performance when applied to a different temporal task or dataset. The challenges of building video datasets has meant that most popular benchmarks for action recognition are small, having on the order of 10k videos.

Please note some benchmarks may be located in the Action Classification or Video Classification tasks, e.g. Kinetics-400.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2676–2700 of 2759 papers

Title	Date	Tasks	Status	Hype
Multimodal Task-Driven Dictionary Learning for Image Classification	Feb 4, 2015	Action RecognitionClassification	CodeCode Available	0
Linear-time Online Action Detection From 3D Skeletal Data Using Bags of Gesturelets	Feb 4, 2015	Action DetectionAction Recognition	—Unverified	0
Learning Latent Spatio-Temporal Compositional Model for Human Action Recognition	Feb 1, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Feature Sampling Strategies for Action Recognition	Jan 28, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Advances in Human Action Recognition: A Survey	Jan 23, 2015	Action RecognitionRetrieval	—Unverified	0
Deep Convolutional Neural Networks for Action Recognition Using Depth Map Sequences	Jan 20, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Reconstruction-free action inference from compressive imagers	Jan 18, 2015	Action RecognitionCompressive Sensing	—Unverified	0
Gradient Boundary Histograms for Action Recognition	Dec 3, 2014	Action RecognitionTemporal Action Localization	—Unverified	0
Learning Spatiotemporal Features with 3D Convolutional Networks	Dec 2, 2014	Action RecognitionAction Recognition In Videos	CodeCode Available	2
Submodular Attribute Selection for Action Recognition in Video	Dec 1, 2014	Action RecognitionAttribute	—Unverified	0
Beyond Gaussian Pyramid: Multi-skip Feature Stacking for Action Recognition	Nov 24, 2014	Action RecognitionEvent Detection	—Unverified	0
CIDEr: Consensus-based Image Description Evaluation	Nov 20, 2014	Action RecognitionAttribute	CodeCode Available	1
A Nonparametric Bayesian Approach Toward Stacked Convolutional Independent Component Analysis	Nov 17, 2014	Action RecognitionTemporal Action Localization	—Unverified	0
A Latent Clothing Attribute Approach for Human Pose Estimation	Nov 16, 2014	Action RecognitionAttribute	—Unverified	0
Histogram of Oriented Principal Components for Cross-View Action Recognition	Sep 24, 2014	3D Action RecognitionAction Recognition	—Unverified	0
Mining Mid-level Features for Action Recognition Based on Effective Skeleton Representation	Sep 14, 2014	3D Action RecognitionAction Recognition	—Unverified	0
10,000+ Times Accelerated Robust Subset Selection (ARSS)	Sep 12, 2014	10-shot image generationAction Recognition	—Unverified	0
Action Recognition in the Frequency Domain	Sep 2, 2014	Action RecognitionOptical Flow Estimation	—Unverified	0
Sparse Coding on Symmetric Positive Definite Manifolds using Bregman Divergences	Aug 30, 2014	Action RecognitionDictionary Learning	—Unverified	0
Temporal Extension of Scale Pyramid and Spatial Pyramid Matching for Action Recognition	Aug 29, 2014	Action RecognitionTemporal Action Localization	—Unverified	0
Skeletal quads: Human action recognition using joint quadruples	Aug 24, 2014	Action RecognitionSkeleton Based Action Recognition	—Unverified	0
Down-Sampling coupled to Elastic Kernel Machines for Efficient Recognition of Isolated Gestures	Aug 18, 2014	Action RecognitionDimensionality Reduction	—Unverified	0
Robust Statistical Approach for Extraction of Moving Human Silhouettes from Videos	Aug 17, 2014	Action ClassificationAction Recognition	—Unverified	0
HOPC: Histogram of Oriented Principal Components of 3D Pointclouds for Action Recognition	Aug 17, 2014	3D Action RecognitionAction Recognition	—Unverified	0
A discussion on the validation tests employed to compare human action recognition methods using the MSR Action3D dataset	Jul 28, 2014	Action RecognitionTemporal Action Localization	—Unverified	0

Show:10 25 50

← PrevPage 108 of 111Next →

All datasets Something-Something V2 UCF101 HMDB-51 Something-Something V1 AVA v2.2 EPIC-KITCHENS-100 NTU RGB+D NTU RGB+D 120 Diving-48 ActivityNet AVA v2.1 H2O (2 Hands and Objects)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MViTv2-B (IN-21K + Kinetics400 pretrain)	Top-5 Accuracy	93.4	—	Unverified
2	RSANet-R50 (8+16 frames, ImageNet pretrained, 2 clips)	Top-5 Accuracy	91.1	—	Unverified
3	MVD (Kinetics400 pretrain, ViT-H, 16 frame)	Top-1 Accuracy	77.3	—	Unverified
4	DejaVid	Top-1 Accuracy	77.2	—	Unverified
5	InternVideo	Top-1 Accuracy	77.2	—	Unverified
6	InternVideo2-1B	Top-1 Accuracy	77.1	—	Unverified
7	VideoMAE V2-g	Top-1 Accuracy	77	—	Unverified
8	MVD (Kinetics400 pretrain, ViT-L, 16 frame)	Top-1 Accuracy	76.7	—	Unverified
9	Hiera-L (no extra data)	Top-1 Accuracy	76.5	—	Unverified
10	TubeViT-L	Top-1 Accuracy	76.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FTP-UniFormerV2-L/14	3-fold Accuracy	99.7	—	Unverified
2	OmniVec2	3-fold Accuracy	99.6	—	Unverified
3	VideoMAE V2-g	3-fold Accuracy	99.6	—	Unverified
4	OmniVec	3-fold Accuracy	99.6	—	Unverified
5	BIKE	3-fold Accuracy	98.8	—	Unverified
6	SMART	3-fold Accuracy	98.64	—	Unverified
7	OmniSource (SlowOnly-8x8-R101-RGB + I3D-Flow)	3-fold Accuracy	98.6	—	Unverified
8	PERF-Net (multi-distilled S3D)	3-fold Accuracy	98.6	—	Unverified
9	ZeroI2V ViT-L/14	3-fold Accuracy	98.6	—	Unverified
10	LGD-3D Two-stream	3-fold Accuracy	98.2	—	Unverified