Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 1477 papers

Title	Date	Tasks	Status
Submodular Attribute Selection for Action Recognition in Video	Dec 1, 2014	Action RecognitionAttribute	—Unverified
Beyond Gaussian Pyramid: Multi-skip Feature Stacking for Action Recognition	Nov 24, 2014	Action RecognitionEvent Detection	—Unverified
A Nonparametric Bayesian Approach Toward Stacked Convolutional Independent Component Analysis	Nov 17, 2014	Action RecognitionTemporal Action Localization	—Unverified
A Latent Clothing Attribute Approach for Human Pose Estimation	Nov 16, 2014	Action RecognitionAttribute	—Unverified
Histogram of Oriented Principal Components for Cross-View Action Recognition	Sep 24, 2014	3D Action RecognitionAction Recognition	—Unverified
Mining Mid-level Features for Action Recognition Based on Effective Skeleton Representation	Sep 14, 2014	3D Action RecognitionAction Recognition	—Unverified
Action Recognition in the Frequency Domain	Sep 2, 2014	Action RecognitionOptical Flow Estimation	—Unverified
Sparse Coding on Symmetric Positive Definite Manifolds using Bregman Divergences	Aug 30, 2014	Action RecognitionDictionary Learning	—Unverified
Temporal Extension of Scale Pyramid and Spatial Pyramid Matching for Action Recognition	Aug 29, 2014	Action RecognitionTemporal Action Localization	—Unverified
Skeletal quads: Human action recognition using joint quadruples	Aug 24, 2014	Action RecognitionSkeleton Based Action Recognition	—Unverified
Down-Sampling coupled to Elastic Kernel Machines for Efficient Recognition of Isolated Gestures	Aug 18, 2014	Action RecognitionDimensionality Reduction	—Unverified
Robust Statistical Approach for Extraction of Moving Human Silhouettes from Videos	Aug 17, 2014	Action ClassificationAction Recognition	—Unverified
HOPC: Histogram of Oriented Principal Components of 3D Pointclouds for Action Recognition	Aug 17, 2014	3D Action RecognitionAction Recognition	—Unverified
TUHOI: Trento Universal Human Object Interaction Dataset	Aug 1, 2014	Human-Object Interaction DetectionObject	—Unverified
A discussion on the validation tests employed to compare human action recognition methods using the MSR Action3D dataset	Jul 28, 2014	Action RecognitionTemporal Action Localization	—Unverified
Feature and Region Selection for Visual Learning	Jul 20, 2014	Action Recognitionfeature selection	—Unverified
Human Action Recognition by Representing 3D Skeletons as Points in a Lie Group	Jun 23, 2014	Action RecognitionDynamic Time Warping	CodeCode Available
Robust Estimation of 3D Human Poses from a Single Image	Jun 9, 2014	3D Human Pose Estimation3D Pose Estimation	—Unverified
Two-Stream Convolutional Networks for Action Recognition in Videos	Jun 9, 2014	Action ClassificationAction Recognition	CodeCode Available
Log-Euclidean Bag of Words for Human Action Recognition	Jun 9, 2014	Action RecognitionOptical Flow Estimation	—Unverified
Continuous Action Recognition Based on Sequence Alignment	Jun 2, 2014	Action RecognitionDynamic Time Warping	—Unverified
Leveraging Hierarchical Parametric Networks for Skeletal Joints Based Action Segmentation and Recognition	Jun 1, 2014	Action RecognitionAction Segmentation	—Unverified
Efficient Nonlinear Markov Models for Human Motion	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Human Action Recognition Across Datasets by Foreground-weighted Histogram Decomposition	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
3D Pose from Motion for Cross-view Action Recognition via Non-linear Circulant Temporal Encoding	Jun 1, 2014	Action RecognitionTemporal Action Localization	CodeCode Available
Human Action Recognition Based on Context-Dependent Graph Kernels	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Efficient Feature Extraction, Encoding and Classification for Action Recognition	Jun 1, 2014	Action ClassificationAction Recognition	—Unverified
Depth and Skeleton Associated Action Recognition without Online Accessible RGB-D Cameras	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
A Cause and Effect Analysis of Motion Trajectories for Modeling Actions	Jun 1, 2014	Action ClassificationAction Recognition	—Unverified
Multi-View Super Vector for Action Recognition	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Towards Good Practices for Action Video Encoding	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Efficient Action Localization with Approximately Normalized Fisher Vectors	Jun 1, 2014	Action LocalizationAction Recognition	—Unverified
DL-SFA: Deeply-Learned Slow Feature Analysis for Action Recognition	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Unsupervised Spectral Dual Assignment Clustering of Human Actions in Context	Jun 1, 2014	Action RecognitionClustering	—Unverified
Simplex-Based 3D Spatio-Temporal Feature Description for Action Recognition	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Range-Sample Depth Feature for Action Recognition	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Feature sampling and partitioning for visual vocabulary generation on large action classification datasets	May 29, 2014	Action ClassificationAction Recognition	—Unverified
Bag of Visual Words and Fusion Methods for Action Recognition: Comprehensive Study and Good Practice	May 18, 2014	Action RecognitionAction Recognition In Videos	—Unverified
Cross-view Action Modeling, Learning and Recognition	May 12, 2014	Action RecognitionTemporal Action Localization	—Unverified
From Synsets to Videos: Enriching ItalWordNet Multimodally	May 1, 2014	Action RecognitionLanguage Acquisition	—Unverified
Shrinkage Optimized Directed Information using Pictorial Structures for Action Recognition	Apr 12, 2014	Action RecognitionTemporal Action Localization	—Unverified
KPCA Spatio-temporal trajectory point cloud classifier for recognizing human actions in a CBVR system	Mar 26, 2014	Action RecognitionRetrieval	—Unverified
Bregman Divergences for Infinite Dimensional Covariance Matrices	Mar 18, 2014	Action RecognitionGeneral Classification	—Unverified
Group sparsity and geometry constrained dictionary learning for action recognition from depth maps.	Mar 3, 2014	Action RecognitionDictionary Learning	—Unverified
Multiview Hessian regularized logistic regression for action recognition	Mar 3, 2014	Action RecognitionAttribute	—Unverified
A Hybrid Loss for Multiclass and Structured Prediction	Feb 9, 2014	Action RecognitionPrediction	—Unverified
Extrinsic Methods for Coding and Dictionary Learning on Grassmann Manifolds	Jan 31, 2014	Action RecognitionClassification	—Unverified
Actions in the Eye: Dynamic Gaze Datasets and Learnt Saliency Models for Visual Recognition	Dec 29, 2013	Action RecognitionTemporal Action Localization	—Unverified
EXMOVES: Classifier-based Features for Scalable Action Recognition	Dec 20, 2013	Action RecognitionGeneral Classification	—Unverified
Action is in the Eye of the Beholder: Eye-gaze Driven Model for Spatio-Temporal Action Localization	Dec 1, 2013	Action LocalizationClassification	—Unverified

Show:10 25 50

← PrevPage 29 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP IOU@0.1	72.5	—	Unverified
5	AGT (Ours)	mAP IOU@0.1	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP IOU@0.5	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP IOU@0.5	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified