Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1477 papers

Title	Date	Tasks	Status	Hype
TALLFormer: Temporal Action Localization with a Long-memory Transformer	Apr 4, 2022	Action LocalizationAction Recognition	CodeCode Available	1
AutoVideo: An Automated Video Action Recognition System	Aug 9, 2021	Action RecognitionAutoML	CodeCode Available	1
AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions	May 23, 2017	Actin DetectionAction Detection	CodeCode Available	1
Proposal-Free Temporal Action Detection via Global Segmentation Mask Learning	Jul 14, 2022	Action DetectionRepresentation Learning	CodeCode Available	1
A Hybrid Attention Mechanism for Weakly-Supervised Temporal Action Localization	Jan 3, 2021	Action LocalizationHard Attention	CodeCode Available	1
Convex Combination Consistency between Neighbors for Weakly-supervised Action Localization	May 1, 2022	Action LocalizationData Augmentation	CodeCode Available	1
Cross-modal Consensus Network forWeakly Supervised Temporal Action Localization	Jul 27, 2021	Action LocalizationTemporal Action Localization	CodeCode Available	1
B2C-AFM: Bi-Directional Co-Temporal and Cross-Spatial Attention Fusion Model for Human Action Recognition	Aug 30, 2023	Action RecognitionSkeleton Based Action Recognition	CodeCode Available	1
DeepSOCIAL: Social Distancing Monitoring and Infection Risk Assessment in COVID-19 Pandemic	Aug 26, 2020	Action RecognitionAnomaly Detection	CodeCode Available	1
Exploring Scalability of Self-Training for Open-Vocabulary Temporal Action Localization	Jul 9, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
Background-Click Supervision for Temporal Action Localization	Nov 24, 2021	Action LocalizationPosition	CodeCode Available	1
Weakly-supervised Temporal Action Localization by Uncertainty Modeling	Jun 12, 2020	Action ClassificationAction Localization	CodeCode Available	1
Background Suppression Network for Weakly-supervised Temporal Action Localization	Nov 22, 2019	Action LocalizationTemporal Action Localization	CodeCode Available	1
Learning Salient Boundary Feature for Anchor-free Temporal Action Localization	Mar 24, 2021	Action LocalizationTemporal Action Localization	CodeCode Available	1
SF-Net: Single-Frame Supervision for Temporal Action Localization	Mar 15, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
BasicTAD: an Astounding RGB-Only Baseline for Temporal Action Detection	May 5, 2022	Action Detectionobject-detection	CodeCode Available	1
A Hierarchical Pose-Based Approach to Complex Action Understanding Using Dictionaries of Actionlets and Motion Poselets	Jun 15, 2016	Action RecognitionAction Understanding	—Unverified	0
A Grid-based Representation for Human Action Recognition	Oct 17, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
Action recognition by learning pose representations	Aug 2, 2017	Action ClassificationAction Recognition	—Unverified	0
A Generative Restricted Boltzmann Machine Based Method for High-Dimensional Motion Data Modeling	Oct 21, 2017	Action RecognitionFacial Expression Recognition	—Unverified	0
A Generative Approach to Zero-Shot and Few-Shot Action Recognition	Jan 27, 2018	Action RecognitionAttribute	—Unverified	0
Action Recognition by Hierarchical Sequence Summarization	Jun 1, 2013	Action RecognitionTemporal Action Localization	—Unverified	0
3DFCNN: Real-Time Action Recognition using 3D Deep Neural Networks with Raw Depth Information	Jun 13, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
A Fine-to-Coarse Convolutional Neural Network for 3D Human Action Recognition	May 30, 2018	3D Action RecognitionAction Recognition	—Unverified	0
Action Recognition by Hierarchical Mid-level Action Elements	Aug 31, 2015	Action ParsingAction Recognition	—Unverified	0
Context Aware Graph Convolution for Skeleton-Based Action Recognition	Jun 1, 2020	Action RecognitionSkeleton Based Action Recognition	—Unverified	0
Adversarial Seeded Sequence Growing for Weakly-Supervised Temporal Action Localization	Aug 7, 2019	Action DetectionAction Localization	—Unverified	0
Action Recognition based on Subdivision-Fusion Model	Aug 18, 2015	Action Recognitionmodel	—Unverified	0
A Compact Kernel Approximation for 3D Action Recognition	Sep 6, 2017	3D Action RecognitionAction Recognition	—Unverified	0
Context-based Object Viewpoint Estimation: A 2D Relational Approach	Apr 21, 2017	Action RecognitionObject	—Unverified	0
Context-LSTM: a robust classifier for video detection on UCF101	Mar 13, 2022	Action DetectionAction Recognition	—Unverified	0
Boosting Semi-Supervised Temporal Action Localization by Learning from Non-Target Classes	Mar 17, 2024	Action LocalizationTemporal Action Localization	—Unverified	0
Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks	Nov 8, 2016	Action RecognitionTemporal Action Localization	—Unverified	0
Adversarial Attacks for Optical Flow-Based Action Recognition Classifiers	Nov 28, 2018	Action RecognitionAdversarial Attack	—Unverified	0
Boosting Point-Supervised Temporal Action Localization through Integrating Query Reformation and Optimal Transport	Jan 1, 2025	Action LocalizationMultiple Instance Learning	—Unverified	0
Concurrence-Aware Long Short-Term Sub-Memories for Person-Person Action Recognition	Jun 3, 2017	Action RecognitionTemporal Action Localization	—Unverified	0
Adversarial Attack on Skeleton-based Human Action Recognition	Sep 14, 2019	Action RecognitionAdversarial Attack	—Unverified	0
Body Joint guided 3D Deep Convolutional Descriptors for Action Recognition	Apr 24, 2017	Action RecognitionTemporal Action Localization	—Unverified	0
Boundary-Aware Proposal Generation Method for Temporal Action Localization	Sep 25, 2023	Action LocalizationAction Recognition	—Unverified	0
Boundary Content Graph Neural Network for Temporal Action Proposal Generation	Aug 4, 2020	Action DetectionAction Understanding	—Unverified	0
Composable Augmentation Encoding for Video Representation Learning	Apr 1, 2021	Action RecognitionContrastive Learning	—Unverified	0
Boundary Uncertainty in a Single-Stage Temporal Action Localization Network	Aug 25, 2020	Action LocalizationTemporal Action Localization	—Unverified	0
Bregman Divergences for Infinite Dimensional Covariance Matrices	Mar 18, 2014	Action RecognitionGeneral Classification	—Unverified	0
Bridge the Gap: From Weak to Full Supervision for Temporal Action Localization with PseudoFormer	Apr 21, 2025	Action LocalizationTemporal Action Localization	—Unverified	0
BLP -- Boundary Likelihood Pinpointing Networks for Accurate Temporal Action Localization	Nov 6, 2018	Action DetectionAction Localization	—Unverified	0
Bridging the gap between Human Action Recognition and Online Action Detection	Jan 21, 2021	Action DetectionAction Recognition	—Unverified	0
Compressed Video Action Recognition with Refined Motion Vector	Oct 6, 2019	Action RecognitionOptical Flow Estimation	—Unverified	0
Blockwise Temporal-Spatial Pathway Network	Aug 5, 2022	Action RecognitionTemporal Action Localization	—Unverified	0
Building Neural Networks on Matrix Manifolds: A Gyrovector Space Approach	May 8, 2023	Action RecognitionKnowledge Graph Completion	—Unverified	0
Bio-Inspired Human Action Recognition using Hybrid Max-Product Neuro-Fuzzy Classifier and Quantum-Behaved PSO	Sep 13, 2015	Action RecognitionForm	—Unverified	0

Show:10 25 50

← PrevPage 5 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP [email protected]	72.5	—	Unverified
5	AGT (Ours)	mAP [email protected]	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP [email protected]	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP [email protected]	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified