Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1477 papers

Title	Date	Tasks	Status
Tensor Representations via Kernel Linearization for Action Recognition from 3D Skeletons (Extended Version)	Apr 1, 2016	3D Action RecognitionAction Recognition	—Unverified
Text-Enhanced Zero-Shot Action Recognition: A training-free approach	Aug 29, 2024	Action RecognitionTemporal Action Localization	—Unverified
Theater Aid System for the Visually Impaired Through Transfer Learning of Spatio-Temporal Graph Convolution Networks	Jun 28, 2023	Action RecognitionDiversity	—Unverified
The Best of Both Worlds: Combining Data-independent and Data-driven Approaches for Action Recognition	May 17, 2015	Action RecognitionMulti-class Classification	—Unverified
The Globally Optimal Reparameterization Algorithm: an Alternative to Fast Dynamic Time Warping for Action Recognition in Video Sequences	Jul 15, 2018	Action RecognitionComputational Efficiency	—Unverified
The Imaginative Generative Adversarial Network: Automatic Data Augmentation for Dynamic Skeleton-Based Hand Gesture and Human Action Recognition	May 27, 2021	Action RecognitionData Augmentation	—Unverified
The THUMOS Challenge on Action Recognition for Videos "in the Wild"	Apr 21, 2016	Action ClassificationAction Recognition	—Unverified
Thin-Slicing for Pose: Learning to Understand Pose Without Explicit Pose Estimation	Jun 1, 2016	Action RecognitionImage Retrieval	—Unverified
Three Birds with One Stone: Multi-Task Temporal Action Detection via Recycling Temporal Annotations	Jun 19, 2021	Action DetectionAction Localization	—Unverified
Three Branches: Detecting Actions With Richer Features	Aug 13, 2019	Action LocalizationActivity Recognition	—Unverified
Three-stream network for enriched Action Recognition	Apr 27, 2021	Action RecognitionActivity Recognition	—Unverified
Advancing Human Action Recognition with Foundation Models trained on Unlabeled Public Videos	Feb 14, 2024	Action RecognitionSelf-Supervised Learning	—Unverified
Time Series Classification using the Hidden-Unit Logistic Model	Jun 16, 2015	Action RecognitionAction Unit Detection	—Unverified
Top-down Attention Recurrent VLAD Encoding for Action Recognition in Videos	Aug 29, 2018	Action RecognitionAction Recognition In Videos	—Unverified
Towards Adaptive Pseudo-label Learning for Semi-Supervised Temporal Action Localization	Jul 10, 2024	Action LocalizationPseudo Label	—Unverified
Towards an Unequivocal Representation of Actions	May 10, 2018	Action RecognitionRetrieval	—Unverified
Towards a Skeleton-Based Action Recognition For Realistic Scenarios	May 14, 2019	Action RecognitionSkeleton Based Action Recognition	—Unverified
Towards Automatic Speech Identification from Vocal Tract Shape Dynamics in Real-time MRI	Jul 29, 2018	Action RecognitionClassification	—Unverified
Towards Good Practices for Action Video Encoding	Jun 1, 2014	Action RecognitionTemporal Action Localization	—Unverified
Towards Improved Human Action Recognition Using Convolutional Neural Networks and Multimodal Fusion of Depth and Inertial Sensor Data	Aug 22, 2020	Action RecognitionTemporal Action Localization	—Unverified
Towards Universal Representation for Unseen Action Recognition	Mar 22, 2018	Action RecognitionMultiple Instance Learning	—Unverified
Tracking Human Pose by Tracking Symmetric Parts	Jun 1, 2013	Action RecognitionPose Estimation	—Unverified
Train, Diagnose and Fix: Interpretable Approach for Fine-grained Action Recognition	Nov 22, 2017	3D Action RecognitionAction Recognition	—Unverified
Training for temporal sparsity in deep neural networks, application in video processing	Jul 15, 2021	Action RecognitionTemporal Action Localization	—Unverified
Trajectory Aligned Features For First Person Action Recognition	Apr 7, 2016	Action RecognitionPoint Tracking	—Unverified
Trajectory Convolution for Action Recognition	Dec 1, 2018	Action RecognitionTemporal Action Localization	—Unverified
Transductive Zero-Shot Action Recognition by Word-Vector Embedding	Nov 13, 2015	Action RecognitionAttribute	—Unverified
Transferable Feature Representation for Visible-to-Infrared Cross-Dataset Human Action Recognition	Sep 18, 2019	Action RecognitionDomain Adaptation	—Unverified
Transferable Knowledge-Based Multi-Granularity Aggregation Network for Temporal Action Localization: Submission to ActivityNet Challenge 2021	Jul 27, 2021	Action LocalizationTemporal Action Localization	—Unverified
Transformer-based Fusion of 2D-pose and Spatio-temporal Embeddings for Distracted Driver Action Recognition	Mar 11, 2024	2D Human Pose EstimationAction Recognition	—Unverified
Transition Forests: Learning Discriminative Temporal Transitions for Action Recognition and Detection	Jul 10, 2016	Action DetectionAction Recognition	—Unverified
TransNet: A Transfer Learning-Based Network for Human Action Recognition	Sep 13, 2023	Action RecognitionTemporal Action Localization	—Unverified
T-RECS: Training for Rate-Invariant Embeddings by Controlling Speed for Action Recognition	Mar 21, 2018	Action RecognitionTemporal Action Localization	—Unverified
Trimmed Action Recognition, Dense-Captioning Events in Videos, and Spatio-temporal Action Localization with Focus on ActivityNet Challenge 2019	Jun 14, 2019	Action LocalizationAction Recognition	—Unverified
TSI: Temporal Saliency Integration for Video Action Recognition	Jun 2, 2021	Action RecognitionTemporal Action Localization	—Unverified
TUHOI: Trento Universal Human Object Interaction Dataset	Aug 1, 2014	Human-Object Interaction DetectionObject	—Unverified
Two-Stream 3D Convolutional Neural Network for Skeleton-Based Action Recognition	May 23, 2017	3D Action RecognitionAction Recognition	—Unverified
Two-Stream Consensus Network for Weakly-Supervised Temporal Action Localization	Oct 22, 2020	Action LocalizationTemporal Action Localization	—Unverified
Two-Stream Consensus Network: Submission to HACS Challenge 2021 Weakly-Supervised Learning Track	Jun 21, 2021	Action LocalizationOptical Flow Estimation	—Unverified
Two Stream LSTM: A Deep Fusion Framework for Human Action Recognition	Apr 4, 2017	Action RecognitionTemporal Action Localization	—Unverified
Two-stream Multi-level Dynamic Point Transformer for Two-person Interaction Recognition	Jul 22, 2023	Action RecognitionTemporal Action Localization	—Unverified
Two-Stream Networks for Lane-Change Prediction of Surrounding Vehicles	Aug 25, 2020	Action RecognitionPrediction	—Unverified
Two-Stream Networks for Weakly-Supervised Temporal Action Localization With Semantic-Aware Mechanisms	Jan 1, 2023	Action LocalizationMultiple Instance Learning	—Unverified
Two-Stream RNN/CNN for Action Recognition in 3D Videos	Mar 22, 2017	Action RecognitionTemporal Action Localization	—Unverified
Two Stream Self-Supervised Learning for Action Recognition	Jun 16, 2018	Action RecognitionRepresentation Learning	—Unverified
Two-stream Spatiotemporal Feature for Video QA Task	Jul 11, 2019	Action RecognitionTemporal Action Localization	—Unverified
UC Merced Submission to the ActivityNet Challenge 2016	Apr 11, 2017	Action RecognitionGeneral Classification	—Unverified
Unified Contrastive Fusion Transformer for Multimodal Human Action Recognition	Sep 10, 2023	Action RecognitionContrastive Learning	—Unverified
Unified Keypoint-based Action Recognition Framework via Structured Keypoint Pooling	Mar 27, 2023	Action LocalizationAction Recognition	—Unverified
UnLoc: A Unified Framework for Video Localization Tasks	Aug 21, 2023	Action SegmentationMoment Retrieval	—Unverified

Show:10 25 50

← PrevPage 18 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP IOU@0.1	72.5	—	Unverified
5	AGT (Ours)	mAP IOU@0.1	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP IOU@0.5	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP IOU@0.5	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified