Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1477 papers

Title	Date	Tasks	Status
Active Learning with Effective Scoring Functions for Semi-Supervised Temporal Action Localization	Aug 31, 2022	Action LocalizationActive Learning	—Unverified
Activity Graph Transformer for Temporal Action Localization	Jan 21, 2021	Action LocalizationTemporal Action Localization	—Unverified
Activity Recognition on a Large Scale in Short Videos - Moments in Time Dataset	Sep 1, 2018	Action RecognitionActivity Recognition	—Unverified
Actor-Centric Relation Network	Jul 28, 2018	Action ClassificationAction Detection	—Unverified
Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition	Nov 28, 2023	Action ClassificationAction Recognition	—Unverified
AdaFuse: Adaptive Temporal Fusion Network for Efficient Action Recognition	Feb 10, 2021	Action RecognitionTemporal Action Localization	—Unverified
Adaptive Down-Sampling and Dimension Reduction in Time Elastic Kernel Machines for Efficient Recognition of Isolated Gestures	Nov 23, 2016	Action RecognitionDimensionality Reduction	—Unverified
Adaptive Hyper-Graph Convolution Network for Skeleton-based Human Action Recognition with Virtual Connections	Nov 22, 2024	Action RecognitionTemporal Action Localization	—Unverified
Adaptive Mutual Supervision for Weakly-Supervised Temporal Action Localization	Apr 6, 2021	Action LocalizationTemporal Action Localization	—Unverified
Adaptive Perception Transformer for Temporal Action Localization	Aug 25, 2022	Action LocalizationTemporal Action Localization	—Unverified
Adaptive RNN Tree for Large-Scale Human Action Recognition	Oct 22, 2017	Action RecognitionSkeleton Based Action Recognition	—Unverified
AdaScan: Adaptive Scan Pooling in Deep Convolutional Neural Networks for Human Action Recognition in Videos	Nov 24, 2016	Action RecognitionAction Recognition In Videos	—Unverified
Adding Attentiveness to the Neurons in Recurrent Neural Networks	Jul 12, 2018	Action RecognitionSkeleton Based Action Recognition	—Unverified
A Deep Learning Approach for Real-Time 3D Human Action Recognition from Skeletal Data	Jul 8, 2019	3D Action RecognitionAction Recognition	—Unverified
A discussion on the validation tests employed to compare human action recognition methods using the MSR Action3D dataset	Jul 28, 2014	Action RecognitionTemporal Action Localization	—Unverified
ADM-Loc: Actionness Distribution Modeling for Point-supervised Temporal Action Localization	Nov 27, 2023	Action ClassificationAction Detection	—Unverified
Advances in Human Action Recognition: A Survey	Jan 23, 2015	Action RecognitionRetrieval	—Unverified
Adversarial Attack on Skeleton-based Human Action Recognition	Sep 14, 2019	Action RecognitionAdversarial Attack	—Unverified
Adversarial Attacks for Optical Flow-Based Action Recognition Classifiers	Nov 28, 2018	Action RecognitionAdversarial Attack	—Unverified
Adversarial Seeded Sequence Growing for Weakly-Supervised Temporal Action Localization	Aug 7, 2019	Action DetectionAction Localization	—Unverified
A Fine-to-Coarse Convolutional Neural Network for 3D Human Action Recognition	May 30, 2018	3D Action RecognitionAction Recognition	—Unverified
A Generative Approach to Zero-Shot and Few-Shot Action Recognition	Jan 27, 2018	Action RecognitionAttribute	—Unverified
A Generative Restricted Boltzmann Machine Based Method for High-Dimensional Motion Data Modeling	Oct 21, 2017	Action RecognitionFacial Expression Recognition	—Unverified
A Grid-based Representation for Human Action Recognition	Oct 17, 2020	Action RecognitionTemporal Action Localization	—Unverified
A Hierarchical Pose-Based Approach to Complex Action Understanding Using Dictionaries of Actionlets and Motion Poselets	Jun 15, 2016	Action RecognitionAction Understanding	—Unverified
A Hybrid Framework for Action Recognition in Low-Quality Video Sequences	Mar 11, 2019	Action RecognitionActivity Recognition	—Unverified
A Hybrid Loss for Multiclass and Structured Prediction	Feb 9, 2014	Action RecognitionPrediction	—Unverified
A Key Volume Mining Deep Framework for Action Recognition	Jun 1, 2016	Action RecognitionAction Recognition In Videos	—Unverified
A Large-Scale Re-identification Analysis in Sporting Scenarios: the Betrayal of Reaching a Critical Point	Dec 29, 2023	Action RecognitionGait Recognition	—Unverified
A Large-Scale Robustness Analysis of Video Action Recognition Models	Jan 1, 2023	Action RecognitionTemporal Action Localization	—Unverified
A Large-scale Varying-view RGB-D Action Dataset for Arbitrary-view Human Action Recognition	Apr 24, 2019	Action AnalysisAction Recognition	—Unverified
A Latent Clothing Attribute Approach for Human Pose Estimation	Nov 16, 2014	Action RecognitionAttribute	—Unverified
Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition	Nov 27, 2023	Action RecognitionRepresentation Learning	—Unverified
Alignment-guided Temporal Attention for Video Action Recognition	Sep 30, 2022	Action RecognitionAttribute	—Unverified
Alternative Semantic Representations for Zero-Shot Human Action Recognition	Jun 28, 2017	Action RecognitionTemporal Action Localization	—Unverified
A Multi-Stream Bi-Directional Recurrent Neural Network for Fine-Grained Action Detection	Jun 1, 2016	Action DetectionAction Recognition	—Unverified
Analyzing Zero-Shot Abilities of Vision-Language Models on Video Understanding Tasks	Oct 7, 2023	Action RecognitionMultiple-choice	—Unverified
An Analysis of Action Recognition Datasets for Language and Vision Tasks	Apr 24, 2017	Action RecognitionImage Retrieval	—Unverified
An Approach to Pose-Based Action Recognition	Jun 1, 2013	Action RecognitionAction Recognition In Videos	—Unverified
An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition	Feb 25, 2019	Action RecognitionSkeleton Based Action Recognition	—Unverified
End-to-End Video Captioning	Apr 4, 2019	Action RecognitionCaption Generation	—Unverified
An End-to-End Spatio-Temporal Attention Model for Human Action Recognition from Skeleton Data	Nov 18, 2016	Action RecognitionSkeleton Based Action Recognition	—Unverified
An End-to-End Two-Stream Network Based on RGB Flow and Representation Flow for Human Action Recognition	Nov 27, 2024	Action RecognitionOptical Flow Estimation	—Unverified
A New Action Recognition Framework for Video Highlights Summarization in Sporting Events	Dec 1, 2020	Action RecognitionTemporal Action Localization	—Unverified
A New Representation of Skeleton Sequences for 3D Action Recognition	Mar 9, 2017	3D Action RecognitionAction Recognition	—Unverified
An Improved Video Analysis using Context based Extension of LSH	May 10, 2017	Action RecognitionRetrieval	—Unverified
An Information-rich Sampling Technique over Spatio-Temporal CNN for Classification of Human Actions in Videos	Feb 6, 2020	Action RecognitionAction Recognition In Videos	—Unverified
Annotation-Efficient Untrimmed Video Action Recognition	Nov 30, 2020	Action RecognitionContrastive Learning	—Unverified
Annotation Methodologies for Vision and Language Dataset Creation	Jul 10, 2016	Action RecognitionImage Description	—Unverified
A Nonparametric Bayesian Approach Toward Stacked Convolutional Independent Component Analysis	Nov 17, 2014	Action RecognitionTemporal Action Localization	—Unverified

Show:10 25 50

← PrevPage 22 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP IOU@0.1	72.5	—	Unverified
5	AGT (Ours)	mAP IOU@0.1	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP IOU@0.5	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP IOU@0.5	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified