Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1477 papers

Title	Date	Tasks	Status
MAiVAR-T: Multimodal Audio-image and Video Action Recognizer using Transformers	Aug 1, 2023	Action RecognitionTemporal Action Localization	—Unverified
Making a Case for Learning Motion Representations with Phase	Sep 6, 2016	Action Recognitionmotion prediction	—Unverified
Making Convolutional Networks Recurrent for Visual Sequence Learning	Jun 1, 2018	Action RecognitionFace Alignment	—Unverified
MAMBA4D: Efficient Long-Sequence Point Cloud Video Understanding with Disentangled Spatial-Temporal State Space Models	May 23, 2024	Action RecognitionAction Segmentation	—Unverified
Manipulated Object Proposal: A Discriminative Object Extraction and Feature Fusion Framework for First-Person Daily Activity Recognition	Sep 2, 2015	Action RecognitionActivity Recognition	—Unverified
Marginalized Average Attentional Network for Weakly-Supervised Learning	May 21, 2019	Action LocalizationTemporal Action Localization	—Unverified
Massively Parallel Video Networks	Jun 11, 2018	Action RecognitionTemporal Action Localization	—Unverified
Matrix Manifold Neural Networks++	May 29, 2024	Action RecognitionNode Classification	—Unverified
Max-Margin Structured Output Regression for Spatio-Temporal Action Localization	Dec 1, 2012	Action LocalizationObject Localization	—Unverified
Memory-Augmented Temporal Dynamic Learning for Action Recognition	Apr 30, 2019	Action RecognitionTemporal Action Localization	—Unverified
Metric-Based Few-Shot Learning for Video Action Recognition	Sep 14, 2019	Action RecognitionFew-Shot Learning	—Unverified
MFAS: Multimodal Fusion Architecture Search	Mar 15, 2019	Action RecognitionGeneral Classification	—Unverified
MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition	Jun 1, 2018	Action RecognitionTemporal Action Localization	—Unverified
Mimetics: Towards Understanding Human Actions Out of Context	Dec 16, 2019	3D Action RecognitionAction Recognition	—Unverified
Minimalistic Video Saliency Prediction via Efficient Decoder & Spatio Temporal Action Cues	Feb 1, 2025	Action ClassificationAction Localization	—Unverified
Mining 3D Key-Pose-Motifs for Action Recognition	Jun 1, 2016	Action RecognitionQuantization	—Unverified
Mining Mid-level Features for Action Recognition Based on Effective Skeleton Representation	Sep 14, 2014	3D Action RecognitionAction Recognition	—Unverified
Mix Dimension in Poincaré Geometry for 3D Skeleton-based Action Recognition	Jul 30, 2020	Action RecognitionAnatomy	—Unverified
MLGCN: Multi-Laplacian Graph Convolutional Networks for Human Action Recognition	Sep 11, 2019	Action RecognitionSkeleton Based Action Recognition	—Unverified
MM-ViT: Multi-Modal Video Transformer for Compressed Video Action Recognition	Aug 20, 2021	Action RecognitionOptical Flow Estimation	—Unverified
Mobile Video Action Recognition	Aug 27, 2019	Action RecognitionTemporal Action Localization	—Unverified
Modality Compensation Network: Cross-Modal Adaptation for Action Recognition	Jan 31, 2020	Action RecognitionOptical Flow Estimation	—Unverified
MODA: Motion-Drift Augmentation for Inertial Human Motion Analysis	Jan 1, 2025	Action RecognitionData Augmentation	—Unverified
Modeling Actions through State Changes	Jun 1, 2013	Action RecognitionTemporal Action Localization	—Unverified
Modeling Representation of Videos for Anomaly Detection using Deep Learning: A Review	May 4, 2015	Action RecognitionAnomaly Detection	—Unverified
Modeling Spatio-Temporal Human Track Structure for Action Localization	Jun 28, 2018	Action LocalizationHuman Detection	—Unverified
Modeling Sub-Event Dynamics in First-Person Action Recognition	Jul 1, 2017	Action RecognitionTemporal Action Localization	—Unverified
Modeling Temporal Dynamics and Spatial Configurations of Actions Using Two-Stream Recurrent Neural Networks	Apr 9, 2017	3D Action RecognitionAction Recognition	—Unverified
Modeling Video Evolution for Action Recognition	Jun 1, 2015	Action RecognitionSkeleton Based Action Recognition	—Unverified
Modelling Temporal Information Using Discrete Fourier Transform for Video Classification	Mar 20, 2016	Action RecognitionClassification	—Unverified
Motion Feature Network: Fixed Motion Filter for Action Recognition	Jul 26, 2018	Action RecognitionAction Recognition In Videos	—Unverified
Motionlets: Mid-level 3D Parts for Human Motion Recognition	Jun 1, 2013	Action RecognitionTemporal Action Localization	—Unverified
Motion Part Regularization: Improving Action Recognition via Trajectory Selection	Jun 1, 2015	Action RecognitionSentence	—Unverified
Motion-Scenario Decoupling for Rat-Aware Video Position Prediction: Strategy and Benchmark	May 17, 2023	Action Recognitionmotion prediction	—Unverified
MS-ASL: A Large-Scale Data Set and Benchmark for Understanding American Sign Language	Dec 3, 2018	Action RecognitionSign Language Recognition	—Unverified
MSSTNet: A Multi-Scale Spatio-Temporal CNN-Transformer Network for Dynamic Facial Expression Recognition	Apr 12, 2024	Action RecognitionAttribute	—Unverified
Multi-Action Recognition via Stochastic Modelling of Optical Flow and Gradients	Feb 6, 2015	Action RecognitionClassification	—Unverified
Multi-Camera Action Dataset for Cross-Camera Action Recognition Benchmarking	Jul 21, 2016	Action RecognitionBenchmarking	—Unverified
Multidomain Multimodal Fusion For Human Action Recognition Using Inertial Sensors	Aug 22, 2020	Action RecognitionTemporal Action Localization	—Unverified
Multi-Expert Human Action Recognition with Hierarchical Super-Class Learning	Dec 13, 2021	Action RecognitionTemporal Action Localization	—Unverified
Multi-Feature Max-Margin Hierarchical Bayesian Model for Action Recognition	Jun 1, 2015	Action RecognitionGeneral Classification	—Unverified
Multi-Granularity Fusion Network for Proposal and Activity Localization: Submission to ActivityNet Challenge 2019 Task 1 and Task 2	Jul 29, 2019	Action LocalizationDiversity	—Unverified
Multi-kernel learning of deep convolutional features for action recognition	Jul 21, 2017	Action RecognitionActivity Recognition	—Unverified
Multi-label Class-imbalanced Action Recognition in Hockey Videos via 3D Convolutional Neural Networks	Sep 5, 2017	Action RecognitionActivity Recognition	—Unverified
Multi-Label Zero-Shot Human Action Recognition via Joint Latent Ranking Embedding	Sep 15, 2017	Action RecognitionMulti-Label Learning	—Unverified
Multi-Level Recurrent Residual Networks for Action Recognition	Nov 22, 2017	Action RecognitionTemporal Action Localization	—Unverified
Multimodal Explanations by Predicting Counterfactuality in Videos	Dec 4, 2018	Action RecognitionAttribute	—Unverified
Multimodal Multipart Learning for Action Recognition in Depth Videos	Jul 31, 2015	Action Recognitionfeature selection	—Unverified
Multi-modal Prompting for Low-Shot Temporal Action Localization	Mar 21, 2023	Action ClassificationAction Localization	—Unverified
Multi-Modal Three-Stream Network for Action Recognition	Sep 8, 2019	Action ClassificationAction Recognition	—Unverified

Show:10 25 50

← PrevPage 22 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP IOU@0.1	72.5	—	Unverified
5	AGT (Ours)	mAP IOU@0.1	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP IOU@0.5	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP IOU@0.5	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified