Action Recognition

Action Recognition is a computer vision task that involves recognizing human actions in videos or images. The goal is to classify and categorize the actions being performed in the video or image into a predefined set of action classes.

In the video domain, it is an open question whether training an action classification network on a sufficiently large dataset, will give a similar boost in performance when applied to a different temporal task or dataset. The challenges of building video datasets has meant that most popular benchmarks for action recognition are small, having on the order of 10k videos.

Please note some benchmarks may be located in the Action Classification or Video Classification tasks, e.g. Kinetics-400.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 2759 papers

Title	Date	Tasks	Status
RNN Fisher Vectors for Action Recognition and Image Annotation	Dec 12, 2015	Action RecognitionTemporal Action Localization	—Unverified
Explaining NonLinear Classification Decisions with Deep Taylor Decomposition	Dec 8, 2015	Action RecognitionClassification	CodeCode Available
Moving poselets: A discriminative and interpretable skeletal motion representation for action recognition	Dec 7, 2015	Action RecognitionDictionary Learning	—Unverified
Rank Pooling for Action Recognition	Dec 6, 2015	Action RecognitionGesture Recognition	CodeCode Available
Actions ~ Transformations	Dec 2, 2015	Action RecognitionTemporal Action Localization	CodeCode Available
Action Detection by Implicit Intentional Motion Clustering	Dec 1, 2015	Action DetectionAction Recognition	—Unverified
Bayesian Non-Parametric Inference for Manifold Based MoCap Representation	Dec 1, 2015	Action RecognitionGeneral Classification	—Unverified
Actionness-Assisted Recognition of Actions	Dec 1, 2015	Action DetectionAction Recognition	—Unverified
Beyond Covariance: Feature Representation With Nonlinear Kernel Matrices	Dec 1, 2015	Action RecognitionTemporal Action Localization	—Unverified
Learning Ensembles of Potential Functions for Structured Prediction With Latent Variables	Dec 1, 2015	Action RecognitionActivity Recognition	—Unverified
Per-Sample Kernel Adaptation for Visual Recognition and Grouping	Dec 1, 2015	Action RecognitionAction Recognition In Videos	—Unverified
Recursive Frechet Mean Computation on the Grassmannian and its Applications to Computer Vision	Dec 1, 2015	Action RecognitionFace Recognition	—Unverified
Category-Blind Human Action Recognition: A Practical Recognition System	Dec 1, 2015	Action RecognitionTemporal Action Localization	—Unverified
Unsupervised Domain Adaptation for Zero-Shot Learning	Dec 1, 2015	Action RecognitionDomain Adaptation	—Unverified
Fine-Grain Annotation of Cricket Videos	Nov 24, 2015	Action RecognitionRetrieval	—Unverified
Delving Deeper into Convolutional Networks for Learning Video Representations	Nov 19, 2015	Action RecognitionDecoder	CodeCode Available
Collecting and Annotating the Large Continuous Action Dataset	Nov 18, 2015	Action RecognitionTemporal Action Localization	—Unverified
From Pose to Activity: Surveying Datasets and Introducing CONVERSE	Nov 18, 2015	Action RecognitionTemporal Action Localization	—Unverified
Hierarchical Spatial Sum-Product Networks for Action Recognition in Still Images	Nov 17, 2015	Action RecognitionAction Recognition In Still Images	—Unverified
Learning Mid-level Words on Riemannian Manifold for Action Recognition	Nov 16, 2015	Action RecognitionClustering	—Unverified
Handcrafted Local Features are Convolutional Neural Networks	Nov 16, 2015	Action RecognitionOptical Flow Estimation	—Unverified
Transductive Zero-Shot Action Recognition by Word-Vector Embedding	Nov 13, 2015	Action RecognitionAttribute	—Unverified
Improving performance of recurrent neural network with relu nonlinearity	Nov 12, 2015	Action RecognitionTemporal Action Localization	—Unverified
Hand-Object Interaction and Precise Localization in Transitive Action Recognition	Nov 12, 2015	Action RecognitionAction Recognition In Still Images	—Unverified
Action Recognition using Visual Attention	Nov 12, 2015	Action RecognitionAction Recognition In Videos	CodeCode Available
Online Action Recognition based on Incremental Learning of Weighted Covariance Descriptors	Nov 10, 2015	Action RecognitionIncremental Learning	—Unverified
Pooling the Convolutional Layers in Deep ConvNets for Action Recognition	Nov 6, 2015	Action Recognitionimage-classification	—Unverified
Action recognition from depth maps using deep convolutional neural networks	Nov 1, 2015	Action RecognitionMultimodal Activity Recognition	—Unverified
Beyond Spatial Pyramid Matching: Space-time Extended Descriptor for Action Recognition	Oct 15, 2015	Action RecognitionDiversity	—Unverified
A Novel Approach for Human Action Recognition from Silhouette Images	Oct 15, 2015	Action DetectionAction Recognition	—Unverified
Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks	Oct 2, 2015	Action Recognitionimage-classification	—Unverified
Long-Range Trajectories from Global and Local Motion Representations	Sep 29, 2015	Action RecognitionMotion Segmentation	—Unverified
Hyper-Fisher Vectors for Action Recognition	Sep 28, 2015	Action RecognitionTemporal Action Localization	—Unverified
Bio-Inspired Human Action Recognition using Hybrid Max-Product Neuro-Fuzzy Classifier and Quantum-Behaved PSO	Sep 13, 2015	Action RecognitionForm	—Unverified
Manipulated Object Proposal: A Discriminative Object Extraction and Feature Fusion Framework for First-Person Daily Activity Recognition	Sep 2, 2015	Action RecognitionActivity Recognition	—Unverified
Action Recognition by Hierarchical Mid-level Action Elements	Aug 31, 2015	Action ParsingAction Recognition	—Unverified
Cooking in the kitchen: Recognizing and Segmenting Human Activities in Videos	Aug 25, 2015	Action RecognitionTemporal Action Localization	—Unverified
Action Recognition based on Subdivision-Fusion Model	Aug 18, 2015	Action Recognitionmodel	—Unverified
Multimodal Multipart Learning for Action Recognition in Depth Videos	Jul 31, 2015	Action Recognitionfeature selection	—Unverified
Action recognition in still images by latent superpixel classification	Jul 30, 2015	Action RecognitionAction Recognition In Still Images	—Unverified
Every Moment Counts: Dense Detailed Labeling of Actions in Complex Videos	Jul 21, 2015	Action RecognitionRetrieval	CodeCode Available
Time Series Classification using the Hidden-Unit Logistic Model	Jun 16, 2015	Action RecognitionAction Unit Detection	—Unverified
Slow and steady feature analysis: higher order temporal coherence in video	Jun 15, 2015	Action RecognitionTemporal Action Localization	—Unverified
P-CNN: Pose-based CNN Features for Action Recognition	Jun 11, 2015	Action RecognitionTemporal Action Localization	—Unverified
Hierarchical recurrent neural network for skeleton based action recognition	Jun 7, 2015	Action RecognitionComputational Efficiency	—Unverified
First-Take-All: Temporal Order-Preserving Hashing for 3D Action Videos	Jun 6, 2015	3D Action RecognitionAction Recognition	—Unverified
Dynamically Encoded Actions Based on Spacetime Saliency	Jun 1, 2015	Action RecognitionTemporal Action Localization	—Unverified
DevNet: A Deep Event Network for Multimedia Event Detection and Evidence Recounting	Jun 1, 2015	Action RecognitionEvent Detection	—Unverified
Motion Part Regularization: Improving Action Recognition via Trajectory Selection	Jun 1, 2015	Action RecognitionSentence	—Unverified
Elastic Functional Coding of Human Actions: From Vector-Fields to Latent Variables	Jun 1, 2015	Action RecognitionClustering	—Unverified

Show:10 25 50

← PrevPage 53 of 56Next →

All datasets Something-Something V2 UCF101 HMDB-51 Something-Something V1 AVA v2.2 EPIC-KITCHENS-100 NTU RGB+D NTU RGB+D 120 Diving-48 ActivityNet AVA v2.1 H2O (2 Hands and Objects)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MViTv2-B (IN-21K + Kinetics400 pretrain)	Top-5 Accuracy	93.4	—	Unverified
2	RSANet-R50 (8+16 frames, ImageNet pretrained, 2 clips)	Top-5 Accuracy	91.1	—	Unverified
3	MVD (Kinetics400 pretrain, ViT-H, 16 frame)	Top-1 Accuracy	77.3	—	Unverified
4	DejaVid	Top-1 Accuracy	77.2	—	Unverified
5	InternVideo	Top-1 Accuracy	77.2	—	Unverified
6	InternVideo2-1B	Top-1 Accuracy	77.1	—	Unverified
7	VideoMAE V2-g	Top-1 Accuracy	77	—	Unverified
8	MVD (Kinetics400 pretrain, ViT-L, 16 frame)	Top-1 Accuracy	76.7	—	Unverified
9	Hiera-L (no extra data)	Top-1 Accuracy	76.5	—	Unverified
10	TubeViT-L	Top-1 Accuracy	76.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FTP-UniFormerV2-L/14	3-fold Accuracy	99.7	—	Unverified
2	OmniVec2	3-fold Accuracy	99.6	—	Unverified
3	VideoMAE V2-g	3-fold Accuracy	99.6	—	Unverified
4	OmniVec	3-fold Accuracy	99.6	—	Unverified
5	BIKE	3-fold Accuracy	98.8	—	Unverified
6	SMART	3-fold Accuracy	98.64	—	Unverified
7	OmniSource (SlowOnly-8x8-R101-RGB + I3D-Flow)	3-fold Accuracy	98.6	—	Unverified
8	PERF-Net (multi-distilled S3D)	3-fold Accuracy	98.6	—	Unverified
9	ZeroI2V ViT-L/14	3-fold Accuracy	98.6	—	Unverified
10	LGD-3D Two-stream	3-fold Accuracy	98.2	—	Unverified