Action Recognition

Action Recognition is a computer vision task that involves recognizing human actions in videos or images. The goal is to classify and categorize the actions being performed in the video or image into a predefined set of action classes.

In the video domain, it is an open question whether training an action classification network on a sufficiently large dataset, will give a similar boost in performance when applied to a different temporal task or dataset. The challenges of building video datasets has meant that most popular benchmarks for action recognition are small, having on the order of 10k videos.

Please note some benchmarks may be located in the Action Classification or Video Classification tasks, e.g. Kinetics-400.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 2759 papers

Title	Date	Tasks	Status
Excitation Backprop for RNNs	Nov 18, 2017	Action RecognitionTemporal Action Localization	CodeCode Available
Action-Attending Graphic Neural Network	Nov 17, 2017	Action AnalysisAction Recognition	—Unverified
Attend and Interact: Higher-Order Object Interactions for Video Understanding	Nov 16, 2017	Action ClassificationAction Recognition	—Unverified
Skepxels: Spatio-temporal Image Representation of Human Skeleton Joints for Action Recognition	Nov 16, 2017	Action AnalysisAction Recognition	—Unverified
End-to-end Video-level Representation Learning for Action Recognition	Nov 11, 2017	Action RecognitionOptical Flow Estimation	CodeCode Available
Egocentric Hand Detection Via Dynamic Region Growing	Nov 10, 2017	Action RecognitionGesture Recognition	—Unverified
Attentional Pooling for Action Recognition	Nov 4, 2017	Action RecognitionHuman-Object Interaction Detection	CodeCode Available
3D CNNs on Distance Matrices for Human Action Recognition	Oct 23, 2017	Action RecognitionSkeleton Based Action Recognition	CodeCode Available
Adaptive RNN Tree for Large-Scale Human Action Recognition	Oct 22, 2017	Action RecognitionSkeleton Based Action Recognition	—Unverified
RPAN: An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos	Oct 22, 2017	Action RecognitionAction Recognition In Videos	CodeCode Available
A Generative Restricted Boltzmann Machine Based Method for High-Dimensional Motion Data Modeling	Oct 21, 2017	Action RecognitionFacial Expression Recognition	—Unverified
Generalized Zero-Shot Learning for Action Recognition with Web-Scale Video Data	Oct 20, 2017	Action RecognitionGeneralized Zero-Shot Learning	—Unverified
Learning to Recognize Actions from Limited Training Examples Using a Recurrent Spiking Neural Model	Oct 19, 2017	Action RecognitionTemporal Action Localization	—Unverified
Real-Time Action Detection in Video Surveillance using Sub-Action Descriptor with Multi-CNN	Oct 10, 2017	Action DetectionAction Recognition	CodeCode Available
CAMREP- Concordia Action and Motion Repository	Oct 6, 2017	Action RecognitionTemporal Action Localization	—Unverified
Flip-Invariant Motion Representation	Oct 1, 2017	Action ClassificationAction Recognition	—Unverified
Ensemble Deep Learning for Skeleton-Based Action Recognition Using Temporal Sliding LSTM Networks	Oct 1, 2017	Action RecognitionSkeleton Based Action Recognition	CodeCode Available
Learning Action Recognition Model From Depth and Skeleton Videos	Oct 1, 2017	Action RecognitionHuman-Object Interaction Detection	—Unverified
Summarization of User-Generated Sports Video by Using Deep Action Recognition Features	Sep 25, 2017	Action RecognitionTemporal Action Localization	—Unverified
Human Action Forecasting by Learning Task Grammars	Sep 19, 2017	Action RecognitionTemporal Action Localization	—Unverified
Multi-Label Zero-Shot Human Action Recognition via Joint Latent Ranking Embedding	Sep 15, 2017	Action RecognitionMulti-Label Learning	—Unverified
Viewpoint Invariant Action Recognition using RGB-D Videos	Sep 15, 2017	Action RecognitionTemporal Action Localization	—Unverified
Learning Gating ConvNet for Two-Stream based Methods in Action Recognition	Sep 12, 2017	Action ClassificationAction Recognition	CodeCode Available
Detecting Hands in Egocentric Videos: Towards Action Recognition	Sep 8, 2017	Action RecognitionHand Detection	—Unverified
A Compact Kernel Approximation for 3D Action Recognition	Sep 6, 2017	3D Action RecognitionAction Recognition	—Unverified
Multi-label Class-imbalanced Action Recognition in Hockey Videos via 3D Convolutional Neural Networks	Sep 5, 2017	Action RecognitionActivity Recognition	—Unverified
Natural Language Descriptions for Human Activities in Video Streams	Sep 1, 2017	Action RecognitionLanguage Modeling	—Unverified
Two-stream Flow-guided Convolutional Attention Networks for Action Recognition	Aug 30, 2017	Action RecognitionAction Recognition In Videos	CodeCode Available
Hierarchical Multi-scale Attention Networks for Action Recognition	Aug 25, 2017	Action RecognitionHard Attention	—Unverified
Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition	Aug 25, 2017	Action RecognitionHand-Gesture Recognition	CodeCode Available
Human Action Recognition System using Good Features and Multilayer Perceptron Network	Aug 22, 2017	Action RecognitionOptical Flow Estimation	—Unverified
Recognizing Involuntary Actions from 3D Skeleton Data Using Body States	Aug 21, 2017	3D Action RecognitionAction Recognition	CodeCode Available
Attentive Semantic Video Generation using Captions	Aug 20, 2017	Action RecognitionStyle Transfer	CodeCode Available
Pillar Networks++: Distributed non-parametric deep and wide networks	Aug 18, 2017	Action RecognitionGaussian Processes	—Unverified
Eigen Evolution Pooling for Human Action Recognition	Aug 17, 2017	Action RecognitionTemporal Action Localization	—Unverified
Fast, invariant representation for human action in the visual system	Aug 15, 2017	Action RecognitionForm	—Unverified
Lattice Long Short-Term Memory for Human Action Recognition	Aug 13, 2017	Action RecognitionOptical Flow Estimation	—Unverified
Extensible Hierarchical Method of Detecting Interactive Actions for Video Understanding	Aug 11, 2017	Action DetectionAction Recognition	—Unverified
Attention Transfer from Web Images for Video Recognition	Aug 3, 2017	Action RecognitionTemporal Action Localization	—Unverified
Unsupervised Representation Learning by Sorting Sequences	Aug 3, 2017	Action Recognitionimage-classification	CodeCode Available
When Kernel Methods meet Feature Learning: Log-Covariance Network for Action Recognition from Skeletal Data	Aug 3, 2017	Action RecognitionTemporal Action Localization	—Unverified
Action recognition by learning pose representations	Aug 2, 2017	Action ClassificationAction Recognition	—Unverified
Enhanced skeleton visualization for view invariant human action recognition	Aug 1, 2017	Action RecognitionSkeleton Based Action Recognition	—Unverified
Learning from Video and Text via Large-Scale Discriminative Clustering	Jul 27, 2017	Action RecognitionClustering	CodeCode Available
Automatic Curation of Golf Highlights using Multimodal Excitement Features	Jul 22, 2017	Action RecognitionRetrieval	—Unverified
Spatio-temporal Human Action Localisation and Instance Segmentation in Temporally Untrimmed Videos	Jul 22, 2017	Action RecognitionInstance Segmentation	—Unverified
Multi-kernel learning of deep convolutional features for action recognition	Jul 21, 2017	Action RecognitionActivity Recognition	—Unverified
Discriminative convolutional Fisher vector network for action recognition	Jul 19, 2017	Action RecognitionAction Recognition In Videos	—Unverified
Skeleton-Based Human Action Recognition with Global Context-Aware Attention LSTM Networks	Jul 18, 2017	Action RecognitionSkeleton Based Action Recognition	—Unverified
Developing the Path Signature Methodology and its Application to Landmark-based Human Action Recognition	Jul 13, 2017	Action ClassificationAction Recognition	—Unverified

Show:10 25 50

← PrevPage 48 of 56Next →

All datasets Something-Something V2 UCF101 HMDB-51 Something-Something V1 AVA v2.2 EPIC-KITCHENS-100 NTU RGB+D NTU RGB+D 120 Diving-48 ActivityNet AVA v2.1 H2O (2 Hands and Objects)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MViTv2-B (IN-21K + Kinetics400 pretrain)	Top-5 Accuracy	93.4	—	Unverified
2	RSANet-R50 (8+16 frames, ImageNet pretrained, 2 clips)	Top-5 Accuracy	91.1	—	Unverified
3	MVD (Kinetics400 pretrain, ViT-H, 16 frame)	Top-1 Accuracy	77.3	—	Unverified
4	DejaVid	Top-1 Accuracy	77.2	—	Unverified
5	InternVideo	Top-1 Accuracy	77.2	—	Unverified
6	InternVideo2-1B	Top-1 Accuracy	77.1	—	Unverified
7	VideoMAE V2-g	Top-1 Accuracy	77	—	Unverified
8	MVD (Kinetics400 pretrain, ViT-L, 16 frame)	Top-1 Accuracy	76.7	—	Unverified
9	Hiera-L (no extra data)	Top-1 Accuracy	76.5	—	Unverified
10	TubeViT-L	Top-1 Accuracy	76.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FTP-UniFormerV2-L/14	3-fold Accuracy	99.7	—	Unverified
2	OmniVec2	3-fold Accuracy	99.6	—	Unverified
3	VideoMAE V2-g	3-fold Accuracy	99.6	—	Unverified
4	OmniVec	3-fold Accuracy	99.6	—	Unverified
5	BIKE	3-fold Accuracy	98.8	—	Unverified
6	SMART	3-fold Accuracy	98.64	—	Unverified
7	OmniSource (SlowOnly-8x8-R101-RGB + I3D-Flow)	3-fold Accuracy	98.6	—	Unverified
8	PERF-Net (multi-distilled S3D)	3-fold Accuracy	98.6	—	Unverified
9	ZeroI2V ViT-L/14	3-fold Accuracy	98.6	—	Unverified
10	LGD-3D Two-stream	3-fold Accuracy	98.2	—	Unverified