Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1477 papers

Title	Date	Tasks	Status	Hype
DeepSOCIAL: Social Distancing Monitoring and Infection Risk Assessment in COVID-19 Pandemic	Aug 26, 2020	Action RecognitionAnomaly Detection	CodeCode Available	1
Temporal Action Localization with Variance-Aware Networks	Aug 25, 2020	Action Localizationregression	—Unverified	0
Boundary Uncertainty in a Single-Stage Temporal Action Localization Network	Aug 25, 2020	Action LocalizationTemporal Action Localization	—Unverified	0
Two-Stream Networks for Lane-Change Prediction of Surrounding Vehicles	Aug 25, 2020	Action RecognitionPrediction	—Unverified	0
Towards Improved Human Action Recognition Using Convolutional Neural Networks and Multimodal Fusion of Depth and Inertial Sensor Data	Aug 22, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
Multidomain Multimodal Fusion For Human Action Recognition Using Inertial Sensors	Aug 22, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
Revisiting Anchor Mechanisms for Temporal Action Localization	Aug 22, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
Accuracy and Performance Comparison of Video Action Recognition Approaches	Aug 20, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
CFAD: Coarse-to-Fine Action Detector for Spatiotemporal Action Localization	Aug 19, 2020	Action DetectionAction Localization	—Unverified	0
Equivalent Classification Mapping for Weakly Supervised Temporal Action Localization	Aug 18, 2020	Action LocalizationClassification	—Unverified	0
ConvGRU in Fine-grained Pitching Action Recognition for Action Outcome Prediction	Aug 18, 2020	Action RecognitionFine-grained Action Recognition	CodeCode Available	0
Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition	Aug 9, 2020	Action RecognitionSkeleton Based Action Recognition	CodeCode Available	0
Single-stage intake gesture detection using CTC loss and extended prefix beam search	Aug 7, 2020	Temporal Action Localization	CodeCode Available	0
Self-supervised Temporal Discriminative Learning for Video Representation Learning	Aug 5, 2020	Action RecognitionRepresentation Learning	CodeCode Available	1
Boundary Content Graph Neural Network for Temporal Action Proposal Generation	Aug 4, 2020	Action DetectionAction Understanding	—Unverified	0
Residual Frames with Efficient Pseudo-3D CNN for Human Action Recognition	Aug 3, 2020	Action RecognitionOptical Flow Estimation	—Unverified	0
Vision and Inertial Sensing Fusion for Human Action Recognition : A Review	Aug 2, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
Multi-view Action Recognition using Cross-view Video Prediction	Aug 1, 2020	Action RecognitionPrediction	CodeCode Available	1
Learning Actionness via Long-range Temporal Order Verification	Aug 1, 2020	Action LocalizationAction Recognition	—Unverified	0
Shuffle and Attend: Video Domain Adaptation	Aug 1, 2020	Action RecognitionDomain Adaptation	—Unverified	0
RubiksNet: Learnable 3D-Shift for Efficient Video Action Recognition	Aug 1, 2020	Action RecognitionTemporal Action Localization	CodeCode Available	1
Mix Dimension in Poincaré Geometry for 3D Skeleton-based Action Recognition	Jul 30, 2020	Action RecognitionAnatomy	—Unverified	0
Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human Action Recognition	Jul 22, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
Perceptron Synthesis Network: Rethinking the Action Scale Variances in Videos	Jul 22, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
Complementary Boundary Generator with Scale-Invariant Relation Modeling for Temporal Action Localization: Submission to ActivityNet Challenge 2020	Jul 20, 2020	Action LocalizationDiversity	—Unverified	0
Hierarchical Contrastive Motion Learning for Video Action Recognition	Jul 20, 2020	Action RecognitionContrastive Learning	—Unverified	0
TinyVIRAT: Low-resolution Video Action Recognition	Jul 14, 2020	Action RecognitionTemporal Action Localization	CodeCode Available	1
IntegralAction: Pose-driven Feature Integration for Robust Human Action Recognition in Videos	Jul 13, 2020	Action RecognitionAction Recognition In Videos	CodeCode Available	1
Multitask Non-Autoregressive Model for Human Motion Prediction	Jul 13, 2020	Action RecognitionDecoder	—Unverified	0
Representation Learning via Adversarially-Contrastive Optimal Transport	Jul 11, 2020	Action RecognitionContrastive Learning	—Unverified	0
Learning Speech Representations from Raw Audio by Joint Audiovisual Self-Supervision	Jul 8, 2020	Acoustic Scene ClassificationAction Recognition	—Unverified	0
Decoupled Spatial-Temporal Attention Network for Skeleton-Based Action Recognition	Jul 7, 2020	Action RecognitionSkeleton Based Action Recognition	CodeCode Available	1
Complex Human Action Recognition in Live Videos Using Hybrid FR-DL Method	Jul 6, 2020	Action RecognitionArticles	—Unverified	0
Weakly Supervised Temporal Action Localization with Segment-Level Labels	Jul 3, 2020	Action LocalizationTemporal Action Localization	—Unverified	0
Path Signatures on Lie Groups	Jul 2, 2020	Action RecognitionTemporal Action Localization	CodeCode Available	0
JUMPS: Joints Upsampling Method for Pose Sequences	Jul 2, 2020	Action RecognitionPose Estimation	—Unverified	0
The IKEA ASM Dataset: Understanding People Assembling Furniture through Actions, Objects and Pose	Jul 1, 2020	Action RecognitionObject	CodeCode Available	1
Roweisposes, Including Eigenposes, Supervised Eigenposes, and Fisherposes, for 3D Action Recognition	Jun 28, 2020	3D Action RecognitionAction Recognition	CodeCode Available	0
1st place solution for AVA-Kinetics Crossover in AcitivityNet Challenge 2020	Jun 16, 2020	Action LocalizationRelation Network	CodeCode Available	1
Actor-Context-Actor Relation Network for Spatio-Temporal Action Localization	Jun 14, 2020	Action DetectionAction Localization	CodeCode Available	1
Exploiting the ConvLSTM: Human Action Recognition using Raw Depth Video-Based Recurrent Neural Networks	Jun 13, 2020	Action RecognitionObject Recognition	—Unverified	0
3DFCNN: Real-Time Action Recognition using 3D Deep Neural Networks with Raw Depth Information	Jun 13, 2020	Action RecognitionTemporal Action Localization	—Unverified	0
DTG-Net: Differentiated Teachers Guided Self-Supervised Video Action Recognition	Jun 13, 2020	Action Recognitionimage-classification	—Unverified	0
Temporal Fusion Network for Temporal Action Localization:Submission to ActivityNet Challenge 2020 (Task E)	Jun 13, 2020	Action ClassificationAction Localization	—Unverified	0
CBR-Net: Cascade Boundary Refinement Network for Action Detection: Submission to ActivityNet Challenge 2020 (Task 1)	Jun 13, 2020	Action DetectionAction Localization	CodeCode Available	1
Weakly-supervised Temporal Action Localization by Uncertainty Modeling	Jun 12, 2020	Action ClassificationAction Localization	CodeCode Available	1
Iterate & Cluster: Iterative Semi-Supervised Action Recognition	Jun 12, 2020	Action RecognitionClustering	CodeCode Available	1
Learning Temporal Co-Attention Models for Unsupervised Video Action Localization	Jun 1, 2020	Action LocalizationClustering	CodeCode Available	0
Context Aware Graph Convolution for Skeleton-Based Action Recognition	Jun 1, 2020	Action RecognitionSkeleton Based Action Recognition	—Unverified	0
Regularization on Spatio-Temporally Smoothed Feature for Action Recognition	Jun 1, 2020	Action RecognitionTemporal Action Localization	—Unverified	0

Show:10 25 50

← PrevPage 13 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP IOU@0.1	72.5	—	Unverified
5	AGT (Ours)	mAP IOU@0.1	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP IOU@0.5	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP IOU@0.5	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified