Video Classification

Video Classification is the task of producing a label that is relevant to the video given its frames. A good video level classifier is one that not only provides accurate frame labels, but also best describes the entire video given the features and the annotations of the various frames in the video. For example, a video might contain a tree in some frame, but the label that is central to the video might be something else (e.g., “hiking”). The granularity of the labels that are needed to describe the frames and the video depends on the task. Typical tasks include assigning one or more global labels to the video, and assigning one or more labels for each frame inside the video.

Source: Efficient Large Scale Video Classification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 455 papers

Title	Date	Tasks	Status
iqiyi Submission to ActivityNet Challenge 2019 Kinetics-700 challenge: Hierarchical Group-wise Attention	Feb 7, 2020	General ClassificationVideo Classification	—Unverified
Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification	Dec 17, 2019	ClassificationGeneral Classification	—Unverified
Appending Adversarial Frames for Universal Video Attack	Dec 10, 2019	ClassificationGeneral Classification	—Unverified
Video action detection by learning graph-based spatio-temporal interactions	Dec 9, 2019	Action DetectionAction Localization	CodeCode Available
VideoDG: Generalizing Temporal Relations in Videos to Novel Domains	Dec 8, 2019	Action RecognitionData Augmentation	CodeCode Available
DASZL: Dynamic Action Signatures for Zero-shot Learning	Dec 8, 2019	Action DetectionActivity Detection	—Unverified
A Spectral Nonlocal Block for Neural Networks	Nov 4, 2019	Action RecognitionFine-Grained Image Classification	—Unverified
Towards Train-Test Consistency for Semi-supervised Temporal Action Localization	Oct 24, 2019	Action LocalizationMultiple Instance Learning	—Unverified
Fast Non-Local Neural Networks with Spectral Residual Learning	Oct 15, 2019	Pose EstimationVideo Classification	CodeCode Available
AWSD: Adaptive Weighted Spatiotemporal Distillation for Video Representation	Oct 1, 2019	General ClassificationVideo Classification	—Unverified
Spectral Nonlocal Block for Neural Network	Sep 25, 2019	Video Classification	—Unverified
UNIVERSAL MODAL EMBEDDING OF DYNAMICS IN VIDEOS AND ITS APPLICATIONS	Sep 25, 2019	DecoderTime Series	—Unverified
Gated Channel Transformation for Visual Recognition	Sep 25, 2019	General Classificationimage-classification	CodeCode Available
Self-Paced Video Data Augmentation with Dynamic Images Generated by Generative Adversarial Networks	Sep 16, 2019	Data AugmentationGeneral Classification	—Unverified
Metric-Based Few-Shot Learning for Video Action Recognition	Sep 14, 2019	Action RecognitionFew-Shot Learning	—Unverified
Identifying and Resisting Adversarial Videos Using Temporal Consistency	Sep 11, 2019	Video Classification	—Unverified
Distributed Deep Convolutional Neural Networks for the Internet-of-Things	Aug 2, 2019	Decision MakingDistributed Computing	—Unverified
Two-Stream Video Classification with Cross-Modality Attention	Aug 1, 2019	Action ClassificationAction Recognition	—Unverified
Multi-Agent Reinforcement Learning Based Frame Sampling for Effective Untrimmed Video Recognition	Jul 31, 2019	Action RecognitionGeneral Classification	—Unverified
AVD: Adversarial Video Distillation	Jul 12, 2019	Activity RecognitionDecoder	—Unverified
Few-Shot Video Classification via Temporal Alignment	Jun 27, 2019	Action RecognitionClassification	—Unverified
Loss Switching Fusion with Similarity Search for Video Classification	Jun 27, 2019	ClassificationClustering	CodeCode Available
Spatio-Temporal Fusion Networks for Action Recognition	Jun 17, 2019	Action RecognitionVideo Classification	—Unverified
Learning Spatio-Temporal Representation with Local and Global Diffusion	Jun 13, 2019	Action ClassificationAction Detection	CodeCode Available
Learning Video Representations using Contrastive Bidirectional Transformer	Jun 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
FASTER Recurrent Networks for Efficient Video Classification	Jun 10, 2019	Action ClassificationAction Recognition	—Unverified
Hierarchical Video Frame Sequence Representation with Deep Convolutional Graph Network	Jun 2, 2019	General ClassificationGraph Neural Network	—Unverified
AssembleNet: Searching for Multi-Stream Neural Connectivity in Video Architectures	May 30, 2019	Action ClassificationAction Recognition	CodeCode Available
Hallucinating Optical Flow Features for Video Classification	May 28, 2019	ClassificationGeneral Classification	CodeCode Available
Exploring Temporal Information for Improved Video Understanding	May 25, 2019	Action RecognitionOptical Flow Estimation	CodeCode Available
VideoGraph: Recognizing Minutes-Long Human Activities in Videos	May 13, 2019	Long-video Activity RecognitionVideo Classification	—Unverified
On Flow Profile Image for Video Representation	May 12, 2019	Activity RecognitionOptical Flow Estimation	—Unverified
Budgeted Training: Rethinking Deep Neural Network Training Under Resource Constraints	May 12, 2019	General Classificationimage-classification	CodeCode Available
MANIFOLDNET: A DEEP NEURAL NETWORK FOR MANIFOLD-VALUED DATA	May 1, 2019	General ClassificationImage Reconstruction	—Unverified
The Expressive Power of Deep Neural Networks with Circulant Matrices	May 1, 2019	General ClassificationVideo Classification	—Unverified
Where and when to look? Spatial-temporal attention for action recognition in videos	May 1, 2019	Action RecognitionAction Recognition In Videos	—Unverified
Factor Analysis in Fault Diagnostics Using Random Forest	Apr 30, 2019	AttributeClustering	—Unverified
DynamoNet: Dynamic Action and Motion Network	Apr 25, 2019	Action RecognitionClassification	—Unverified
Multi-Branch Tensor Network Structure for Tensor-Train Discriminant Analysis	Apr 15, 2019	ClassificationGeneral Classification	CodeCode Available
Video Classification with Channel-Separated Convolutional Networks	Apr 4, 2019	Action ClassificationAction Recognition	CodeCode Available
Robust Real-Time Violence Detection in Video Using CNN And LSTM	Mar 27, 2019	Action Recognition In VideosVideo Classification	CodeCode Available
Semantic Adversarial Network with Multi-scale Pyramid Attention for Video Classification	Mar 6, 2019	ClassificationGeneral Classification	—Unverified
Video-based surgical skill assessment using 3D convolutional neural networks	Mar 6, 2019	Action Quality AssessmentSurgical Skills Evaluation	CodeCode Available
Efficient Video Classification Using Fewer Frames	Feb 27, 2019	ClassificationClustering	CodeCode Available
Saliency Tubes: Visual Explanations for Spatio-Temporal Convolutions	Feb 4, 2019	Action ClassificationGeneral Classification	CodeCode Available
Understanding and Training Deep Diagonal Circulant Neural Networks	Jan 29, 2019	Video Classification	—Unverified
Adversarial Framing for Image and Video Classification	Dec 11, 2018	ClassificationGeneral Classification	CodeCode Available
MS-ASL: A Large-Scale Data Set and Benchmark for Understanding American Sign Language	Dec 3, 2018	Action RecognitionSign Language Recognition	—Unverified
Deep Multimodal Learning: An Effective Method for Video Classification	Nov 30, 2018	ClassificationGeneral Classification	—Unverified
Unsupervised Meta-Learning For Few-Shot Image Classification	Nov 28, 2018	ClassificationFew-Shot Image Classification	—Unverified

Show:10 25 50

← PrevPage 7 of 10Next →

All datasets Breakfast COIN MoB YouTube-8M Hockey Fight Detection Dataset Charades Home Action Genome Kinetics Multimodal PISA Something-Something V1 Something-Something V2 SRI-APPROVE Fine-Grained Video Classification

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	HERMES	Accuracy (%)	95.2	—	Unverified
2	MA-LMM	Accuracy (%)	93	—	Unverified
3	S5	Accuracy (%)	90.7	—	Unverified
4	TranS4mer	Accuracy (%)	90.27	—	Unverified
5	D-Sprv.	Accuracy (%)	89.9	—	Unverified
6	ViS4mer	Accuracy (%)	88.2	—	Unverified
7	GHRM	Accuracy (%)	75.5	—	Unverified
8	Timeception	Accuracy (%)	71.3	—	Unverified
9	VideoGraph	Accuracy (%)	69.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HERMES	Accuracy (%)	93.5	—	Unverified
2	MA-LMM	Accuracy (%)	93.2	—	Unverified
3	S5	Accuracy (%)	90.8	—	Unverified
4	D-Sprv.	Accuracy (%)	90	—	Unverified
5	TranS4mer	Accuracy (%)	89.3	—	Unverified
6	ViS4mer	Accuracy (%)	88.4	—	Unverified
7	TSN	Accuracy (%)	73.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTN	Accuracy	77.85	—	Unverified
2	I3D	Accuracy	72.11	—	Unverified
3	ConvLSTM	Accuracy	69.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCGN (self-attention graph pooling)	Hit@1	87.7	—	Unverified
2	Hierarchical LSTM with MoE	Hit@1	86.8	—	Unverified
3	Mixture-of-2-Experts	Hit@1	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Structured Keypoint Pooling	Accuracy	99.5	—	Unverified
2	CNN+LSTM	1:1 Accuracy	98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Multigrid	mAP	38.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Cooperative Ours (3rd-person)	Accuracy (%)	24.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Multigrid	Top-1	77.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video	Accuracy (%)	73.95	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSNet-R50En (ours)	Top-5 Accuracy	84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MSNet-R50En (ours)	Top-5 Accuracy	91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Multi-Label Prototypes Contrastive Learning	AUPR	88.4	—	Unverified