Temporal Action Localization

Temporal Action Localization aims to detect activities in the video stream and output beginning and end timestamps. It is closely related to Temporal Action Proposal Generation.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1477 papers

Title	Date	Tasks	Status
Label Efficient Learning of Transferable Representations acrosss Domains and Tasks	Dec 1, 2017	Action RecognitionMetric Learning	—Unverified
Label Efficient Learning of Transferable Representations across Domains and Tasks	Nov 30, 2017	Action RecognitionMetric Learning	—Unverified
Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition	Nov 29, 2017	Action RecognitionAction Recognition In Videos	CodeCode Available
Revisiting hand-crafted feature for action recognition: a set of improved dense trajectories	Nov 28, 2017	Action RecognitionTemporal Action Localization	CodeCode Available
Scalable and Compact 3D Action Recognition with Approximated RBF Kernel Machines	Nov 28, 2017	3D Action RecognitionAction Recognition	—Unverified
Highly Efficient Human Action Recognition with Quantum Genetic Algorithm Optimized Support Vector Machine	Nov 27, 2017	Action ClassificationAction Recognition	—Unverified
Predictive Learning: Using Future Representation Learning Variantial Autoencoder for Human Action Prediction	Nov 25, 2017	Action RecognitionRepresentation Learning	—Unverified
Appearance-and-Relation Networks for Video Classification	Nov 24, 2017	Action ClassificationAction Recognition	CodeCode Available
Train, Diagnose and Fix: Interpretable Approach for Fine-grained Action Recognition	Nov 22, 2017	3D Action RecognitionAction Recognition	—Unverified
Multi-Level Recurrent Residual Networks for Action Recognition	Nov 22, 2017	Action RecognitionTemporal Action Localization	—Unverified
Action Recognition with Coarse-to-Fine Deep Feature Integration and Asynchronous Fusion	Nov 20, 2017	Action RecognitionTemporal Action Localization	—Unverified
Excitation Backprop for RNNs	Nov 18, 2017	Action RecognitionTemporal Action Localization	CodeCode Available
Action-Attending Graphic Neural Network	Nov 17, 2017	Action AnalysisAction Recognition	—Unverified
Skepxels: Spatio-temporal Image Representation of Human Skeleton Joints for Action Recognition	Nov 16, 2017	Action AnalysisAction Recognition	—Unverified
Attend and Interact: Higher-Order Object Interactions for Video Understanding	Nov 16, 2017	Action ClassificationAction Recognition	—Unverified
End-to-end Video-level Representation Learning for Action Recognition	Nov 11, 2017	Action RecognitionOptical Flow Estimation	CodeCode Available
Egocentric Hand Detection Via Dynamic Region Growing	Nov 10, 2017	Action RecognitionGesture Recognition	—Unverified
Attentional Pooling for Action Recognition	Nov 4, 2017	Action RecognitionHuman-Object Interaction Detection	CodeCode Available
3D CNNs on Distance Matrices for Human Action Recognition	Oct 23, 2017	Action RecognitionSkeleton Based Action Recognition	CodeCode Available
Adaptive RNN Tree for Large-Scale Human Action Recognition	Oct 22, 2017	Action RecognitionSkeleton Based Action Recognition	—Unverified
A Generative Restricted Boltzmann Machine Based Method for High-Dimensional Motion Data Modeling	Oct 21, 2017	Action RecognitionFacial Expression Recognition	—Unverified
Generalized Zero-Shot Learning for Action Recognition with Web-Scale Video Data	Oct 20, 2017	Action RecognitionGeneralized Zero-Shot Learning	—Unverified
Learning to Recognize Actions from Limited Training Examples Using a Recurrent Spiking Neural Model	Oct 19, 2017	Action RecognitionTemporal Action Localization	—Unverified
Real-Time Action Detection in Video Surveillance using Sub-Action Descriptor with Multi-CNN	Oct 10, 2017	Action DetectionAction Recognition	CodeCode Available
CAMREP- Concordia Action and Motion Repository	Oct 6, 2017	Action RecognitionTemporal Action Localization	—Unverified
Ensemble Deep Learning for Skeleton-Based Action Recognition Using Temporal Sliding LSTM Networks	Oct 1, 2017	Action RecognitionSkeleton Based Action Recognition	CodeCode Available
Flip-Invariant Motion Representation	Oct 1, 2017	Action ClassificationAction Recognition	—Unverified
Learning Action Recognition Model From Depth and Skeleton Videos	Oct 1, 2017	Action RecognitionHuman-Object Interaction Detection	—Unverified
Summarization of User-Generated Sports Video by Using Deep Action Recognition Features	Sep 25, 2017	Action RecognitionTemporal Action Localization	—Unverified
Human Action Forecasting by Learning Task Grammars	Sep 19, 2017	Action RecognitionTemporal Action Localization	—Unverified
Viewpoint Invariant Action Recognition using RGB-D Videos	Sep 15, 2017	Action RecognitionTemporal Action Localization	—Unverified
Multi-Label Zero-Shot Human Action Recognition via Joint Latent Ranking Embedding	Sep 15, 2017	Action RecognitionMulti-Label Learning	—Unverified
Learning Gating ConvNet for Two-Stream based Methods in Action Recognition	Sep 12, 2017	Action ClassificationAction Recognition	CodeCode Available
Detecting Hands in Egocentric Videos: Towards Action Recognition	Sep 8, 2017	Action RecognitionHand Detection	—Unverified
A Compact Kernel Approximation for 3D Action Recognition	Sep 6, 2017	3D Action RecognitionAction Recognition	—Unverified
Multi-label Class-imbalanced Action Recognition in Hockey Videos via 3D Convolutional Neural Networks	Sep 5, 2017	Action RecognitionActivity Recognition	—Unverified
Natural Language Descriptions for Human Activities in Video Streams	Sep 1, 2017	Action RecognitionLanguage Modeling	—Unverified
Two-stream Flow-guided Convolutional Attention Networks for Action Recognition	Aug 30, 2017	Action RecognitionAction Recognition In Videos	CodeCode Available
Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition	Aug 25, 2017	Action RecognitionHand-Gesture Recognition	CodeCode Available
Hierarchical Multi-scale Attention Networks for Action Recognition	Aug 25, 2017	Action RecognitionHard Attention	—Unverified
Human Action Recognition System using Good Features and Multilayer Perceptron Network	Aug 22, 2017	Action RecognitionOptical Flow Estimation	—Unverified
Recognizing Involuntary Actions from 3D Skeleton Data Using Body States	Aug 21, 2017	3D Action RecognitionAction Recognition	CodeCode Available
Attentive Semantic Video Generation using Captions	Aug 20, 2017	Action RecognitionStyle Transfer	CodeCode Available
Pillar Networks++: Distributed non-parametric deep and wide networks	Aug 18, 2017	Action RecognitionGaussian Processes	—Unverified
Eigen Evolution Pooling for Human Action Recognition	Aug 17, 2017	Action RecognitionTemporal Action Localization	—Unverified
Lattice Long Short-Term Memory for Human Action Recognition	Aug 13, 2017	Action RecognitionOptical Flow Estimation	—Unverified
Exploring Temporal Preservation Networks for Precise Temporal Action Localization	Aug 10, 2017	Action LocalizationOpen-Ended Question Answering	—Unverified
Unsupervised Representation Learning by Sorting Sequences	Aug 3, 2017	Action Recognitionimage-classification	CodeCode Available
Attention Transfer from Web Images for Video Recognition	Aug 3, 2017	Action RecognitionTemporal Action Localization	—Unverified
When Kernel Methods meet Feature Learning: Log-Covariance Network for Action Recognition from Skeletal Data	Aug 3, 2017	Action RecognitionTemporal Action Localization	—Unverified

Show:10 25 50

← PrevPage 22 of 30Next →

All datasets THUMOS14 ActivityNet-1.3 HACS FineAction MultiTHUMOS CrossTask EPIC-KITCHENS-100 MUSES ActivityNet-1.2 Ego4D MQ test Ego4D MQ val MEXaction2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (VideoMAEv2-giant)	Avg mAP (0.3:0.7)	76.9	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	Avg mAP (0.3:0.7)	74.2	—	Unverified
3	ActionMamba(InternVideo2-6B)	Avg mAP (0.3:0.7)	72.72	—	Unverified
4	GCM	mAP IOU@0.1	72.5	—	Unverified
5	AGT (Ours)	mAP IOU@0.1	72.1	—	Unverified
6	InternVideo2-6B	Avg mAP (0.3:0.7)	72	—	Unverified
7	ActionFormer (InternVideo features)	Avg mAP (0.3:0.7)	71.58	—	Unverified
8	TriDet (VideoMAE v2-g feature)	Avg mAP (0.3:0.7)	70.1	—	Unverified
9	InternVideo2-1B	Avg mAP (0.3:0.7)	69.8	—	Unverified
10	ActionFormer (VideoMAE V2-g features)	Avg mAP (0.3:0.7)	69.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	mAP IOU@0.5	59.3	—	Unverified
2	RDFA-S6 (InternVideo2-6B)	mAP	42.9	—	Unverified
3	ActionMamba (InternVideo2-6B)	mAP	42.02	—	Unverified
4	PRN+BMN (ensemble)	mAP	42	—	Unverified
5	AdaTAD (VideoMAEv2-giant)	mAP	41.93	—	Unverified
6	InternVideo2-6B	mAP	41.2	—	Unverified
7	InternVideo2-1B	mAP	40.4	—	Unverified
8	UniMD+Sync.	mAP	39.83	—	Unverified
9	PRN (CSN)	mAP	39.4	—	Unverified
10	InternVideo	mAP	39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	Average-mAP	45.8	—	Unverified
2	ActionMamba(InternVideo2-6B)	Average-mAP	44.56	—	Unverified
3	DyFADet(VideoMAEv2)	Average-mAP	44.3	—	Unverified
4	InternVideo2-6B	Average-mAP	43.3	—	Unverified
5	TriDet (VideoMAEv2)	Average-mAP	43.1	—	Unverified
6	InternVideo2-1B	Average-mAP	42.4	—	Unverified
7	InternVideo	Average-mAP	41.55	—	Unverified
8	TriDet (SlowFast)	Average-mAP	38.6	—	Unverified
9	TriDet (I3D RGB)	Average-mAP	36.8	—	Unverified
10	TadTr (I3D RGB)	Average-mAP	32.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RDFA-S6 (InternVideo2-6B)	mAP	29.6	—	Unverified
2	ActionMamba(InternVideo2-6B)	mAP	29.04	—	Unverified
3	InternVideo2-6B	mAP	27.7	—	Unverified
4	DyFADet (VideoMAE v2-g)	mAP	23.8	—	Unverified
5	VideoMAE V2-g	mAP	18.24	—	Unverified
6	InternVideo	mAP	17.57	—	Unverified
7	BMN (i3d feaure)	mAP	9.25	—	Unverified
8	G-TAD (i3d feature)	mAP	9.06	—	Unverified
9	DBG (i3d feature)	mAP	6.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TriDet (VideoMAEv2)	Average mAP	37.5	—	Unverified
2	DualDETR (I3D-rgb)	Average mAP	32.64	—	Unverified
3	TriDet (I3D-rgb)	Average mAP	30.7	—	Unverified
4	TemporalMaxer	Average mAP	29.9	—	Unverified
5	PointTAD	Average mAP	23.5	—	Unverified
6	PDAN	Average mAP	17.3	—	Unverified
7	MS-TCT	Average mAP	16.2	—	Unverified
8	MLAD	Average mAP	14.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCLIP	Recall	47.3	—	Unverified
2	VLM	Recall	46.5	—	Unverified
3	TACo	Recall	42.5	—	Unverified
4	Text-Video Embedding	Recall	33.6	—	Unverified
5	Fully-supervised upper-bound	Recall	31.6	—	Unverified
6	Zhukov	Recall	22.4	—	Unverified
7	Alayrac	Recall	13.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaTAD (verb, VideoMAE-L)	Avg mAP (0.1-0.5)	29.3	—	Unverified
2	TriDet (verb)	Avg mAP (0.1-0.5)	25.4	—	Unverified
3	TemporalMaxer (verb)	Avg mAP (0.1-0.5)	24.5	—	Unverified
4	ActionFormer (verb)	Avg mAP (0.1-0.5)	23.5	—	Unverified
5	G-TAD (verb)	Avg mAP (0.1-0.5)	9.4	—	Unverified
6	BMN (verb)	Avg mAP (0.1-0.5)	8.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TemporalMaxer	mAP	27.2	—	Unverified
2	MUSES	mAP	18.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepMetricLearner	mAP IOU@0.5	35.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ActionFormer (SlowFast+Omnivore+EgoVLP)	Average mAP	21.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	S-CNN	mAP	7.4	—	Unverified