Action Recognition

Action Recognition is a computer vision task that involves recognizing human actions in videos or images. The goal is to classify and categorize the actions being performed in the video or image into a predefined set of action classes.

In the video domain, it is an open question whether training an action classification network on a sufficiently large dataset, will give a similar boost in performance when applied to a different temporal task or dataset. The challenges of building video datasets has meant that most popular benchmarks for action recognition are small, having on the order of 10k videos.

Please note some benchmarks may be located in the Action Classification or Video Classification tasks, e.g. Kinetics-400.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2700 of 2759 papers

Title	Date	Tasks	Status	Hype
Dynamically Encoded Actions Based on Spacetime Saliency	Jun 1, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Elastic Functional Coding of Human Actions: From Vector-Fields to Latent Variables	Jun 1, 2015	Action RecognitionClustering	—Unverified	0
Motion Part Regularization: Improving Action Recognition via Trajectory Selection	Jun 1, 2015	Action RecognitionSentence	—Unverified	0
A Novel Locally Linear KNN Model for Visual Recognition	Jun 1, 2015	Action RecognitionDensity Estimation	—Unverified	0
Delving Into Egocentric Actions	Jun 1, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Joint Action Recognition and Pose Estimation From Video	Jun 1, 2015	Action RecognitionPose Estimation	—Unverified	0
What do 15,000 Object Categories Tell Us About Classifying and Localizing Actions?	Jun 1, 2015	Action ClassificationAction Recognition	—Unverified	0
Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors	May 19, 2015	Action RecognitionAction Understanding	CodeCode Available	0
Visual Semantic Role Labeling	May 17, 2015	16kAction Classification	CodeCode Available	1
The Best of Both Worlds: Combining Data-independent and Data-driven Approaches for Action Recognition	May 17, 2015	Action RecognitionMulti-class Classification	—Unverified	0
Contextual Action Recognition with R*CNN	May 5, 2015	Action RecognitionAttribute	CodeCode Available	0
Modeling Representation of Videos for Anomaly Detection using Deep Learning: A Review	May 4, 2015	Action RecognitionAnomaly Detection	—Unverified	0
Fusing multiple features for depth-based action recognition	May 1, 2015	3D Action RecognitionAction Recognition	—Unverified	0
Differential Recurrent Neural Networks for Action Recognition	Apr 25, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
A robust and efficient video representation for action recognition	Apr 21, 2015	Action RecognitionHomography Estimation	—Unverified	0
Learning discriminative trajectorylet detector sets for accurate skeleton-based action recognition	Apr 20, 2015	Action RecognitionSkeleton Based Action Recognition	—Unverified	0
Temporal Localization of Fine-Grained Actions in Videos by Domain Transfer from Web Images	Apr 4, 2015	Action LocalizationAction Recognition	CodeCode Available	0
Beyond Short Snippets: Deep Networks for Video Classification	Mar 31, 2015	Action RecognitionClassification	CodeCode Available	0
Discriminative Bayesian Dictionary Learning for Classification	Mar 27, 2015	Action RecognitionClassification	—Unverified	0
Video-Based Action Recognition Using Rate-Invariant Analysis of Covariance Trajectories	Mar 23, 2015	Action RecognitionGeneral Classification	—Unverified	0
Temporal Pyramid Pooling Based Convolutional Neural Networks for Action Recognition	Mar 4, 2015	Action Recognitionimage-classification	—Unverified	0
Describing Videos by Exploiting Temporal Structure	Feb 27, 2015	Action RecognitionImage Description	CodeCode Available	0
Unsupervised Learning of Video Representations using LSTMs	Feb 16, 2015	Action RecognitionDecoder	CodeCode Available	1
Multi-Action Recognition via Stochastic Modelling of Optical Flow and Gradients	Feb 6, 2015	Action RecognitionClassification	—Unverified	0
Semantic Embedding Space for Zero-Shot Action Recognition	Feb 5, 2015	Action RecognitionAttribute	—Unverified	0
Multimodal Task-Driven Dictionary Learning for Image Classification	Feb 4, 2015	Action RecognitionClassification	CodeCode Available	0
Linear-time Online Action Detection From 3D Skeletal Data Using Bags of Gesturelets	Feb 4, 2015	Action DetectionAction Recognition	—Unverified	0
Learning Latent Spatio-Temporal Compositional Model for Human Action Recognition	Feb 1, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Feature Sampling Strategies for Action Recognition	Jan 28, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Advances in Human Action Recognition: A Survey	Jan 23, 2015	Action RecognitionRetrieval	—Unverified	0
Deep Convolutional Neural Networks for Action Recognition Using Depth Map Sequences	Jan 20, 2015	Action RecognitionTemporal Action Localization	—Unverified	0
Reconstruction-free action inference from compressive imagers	Jan 18, 2015	Action RecognitionCompressive Sensing	—Unverified	0
Gradient Boundary Histograms for Action Recognition	Dec 3, 2014	Action RecognitionTemporal Action Localization	—Unverified	0
Learning Spatiotemporal Features with 3D Convolutional Networks	Dec 2, 2014	Action RecognitionAction Recognition In Videos	CodeCode Available	2
Submodular Attribute Selection for Action Recognition in Video	Dec 1, 2014	Action RecognitionAttribute	—Unverified	0
Beyond Gaussian Pyramid: Multi-skip Feature Stacking for Action Recognition	Nov 24, 2014	Action RecognitionEvent Detection	—Unverified	0
CIDEr: Consensus-based Image Description Evaluation	Nov 20, 2014	Action RecognitionAttribute	CodeCode Available	1
A Nonparametric Bayesian Approach Toward Stacked Convolutional Independent Component Analysis	Nov 17, 2014	Action RecognitionTemporal Action Localization	—Unverified	0
A Latent Clothing Attribute Approach for Human Pose Estimation	Nov 16, 2014	Action RecognitionAttribute	—Unverified	0
Histogram of Oriented Principal Components for Cross-View Action Recognition	Sep 24, 2014	3D Action RecognitionAction Recognition	—Unverified	0
Mining Mid-level Features for Action Recognition Based on Effective Skeleton Representation	Sep 14, 2014	3D Action RecognitionAction Recognition	—Unverified	0
10,000+ Times Accelerated Robust Subset Selection (ARSS)	Sep 12, 2014	10-shot image generationAction Recognition	—Unverified	0
Action Recognition in the Frequency Domain	Sep 2, 2014	Action RecognitionOptical Flow Estimation	—Unverified	0
Sparse Coding on Symmetric Positive Definite Manifolds using Bregman Divergences	Aug 30, 2014	Action RecognitionDictionary Learning	—Unverified	0
Temporal Extension of Scale Pyramid and Spatial Pyramid Matching for Action Recognition	Aug 29, 2014	Action RecognitionTemporal Action Localization	—Unverified	0
Skeletal quads: Human action recognition using joint quadruples	Aug 24, 2014	Action RecognitionSkeleton Based Action Recognition	—Unverified	0
Down-Sampling coupled to Elastic Kernel Machines for Efficient Recognition of Isolated Gestures	Aug 18, 2014	Action RecognitionDimensionality Reduction	—Unverified	0
Robust Statistical Approach for Extraction of Moving Human Silhouettes from Videos	Aug 17, 2014	Action ClassificationAction Recognition	—Unverified	0
HOPC: Histogram of Oriented Principal Components of 3D Pointclouds for Action Recognition	Aug 17, 2014	3D Action RecognitionAction Recognition	—Unverified	0
A discussion on the validation tests employed to compare human action recognition methods using the MSR Action3D dataset	Jul 28, 2014	Action RecognitionTemporal Action Localization	—Unverified	0

Show:10 25 50

← PrevPage 54 of 56Next →

All datasets Something-Something V2 UCF101 HMDB-51 Something-Something V1 AVA v2.2 EPIC-KITCHENS-100 NTU RGB+D NTU RGB+D 120 Diving-48 ActivityNet AVA v2.1 H2O (2 Hands and Objects)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MViTv2-B (IN-21K + Kinetics400 pretrain)	Top-5 Accuracy	93.4	—	Unverified
2	RSANet-R50 (8+16 frames, ImageNet pretrained, 2 clips)	Top-5 Accuracy	91.1	—	Unverified
3	MVD (Kinetics400 pretrain, ViT-H, 16 frame)	Top-1 Accuracy	77.3	—	Unverified
4	DejaVid	Top-1 Accuracy	77.2	—	Unverified
5	InternVideo	Top-1 Accuracy	77.2	—	Unverified
6	InternVideo2-1B	Top-1 Accuracy	77.1	—	Unverified
7	VideoMAE V2-g	Top-1 Accuracy	77	—	Unverified
8	MVD (Kinetics400 pretrain, ViT-L, 16 frame)	Top-1 Accuracy	76.7	—	Unverified
9	Hiera-L (no extra data)	Top-1 Accuracy	76.5	—	Unverified
10	TubeViT-L	Top-1 Accuracy	76.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FTP-UniFormerV2-L/14	3-fold Accuracy	99.7	—	Unverified
2	OmniVec2	3-fold Accuracy	99.6	—	Unverified
3	VideoMAE V2-g	3-fold Accuracy	99.6	—	Unverified
4	OmniVec	3-fold Accuracy	99.6	—	Unverified
5	BIKE	3-fold Accuracy	98.8	—	Unverified
6	SMART	3-fold Accuracy	98.64	—	Unverified
7	OmniSource (SlowOnly-8x8-R101-RGB + I3D-Flow)	3-fold Accuracy	98.6	—	Unverified
8	PERF-Net (multi-distilled S3D)	3-fold Accuracy	98.6	—	Unverified
9	ZeroI2V ViT-L/14	3-fold Accuracy	98.6	—	Unverified
10	LGD-3D Two-stream	3-fold Accuracy	98.2	—	Unverified