Action Localization

Action Localization is finding the spatial and temporal co ordinates for an action in a video. An action localization model will identify which frame an action start and ends in video and return the x,y coordinates of an action. Further the co ordinates will change when the object performing action undergoes a displacement.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 369 papers

Title	Date	Tasks	Status	Hype
Multi-shot Temporal Event Localization: a Benchmark	Dec 17, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
VideoMix: Rethinking Data Augmentation for Video Classification	Dec 7, 2020	Action LocalizationAction Recognition	CodeCode Available	1
Video Self-Stitching Graph Network for Temporal Action Localization	Nov 30, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
TSP: Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks	Nov 23, 2020	Action ClassificationAction Localization	CodeCode Available	1
BSN++: Complementary Boundary Regressor with Scale-Balanced Relation Modeling for Temporal Action Proposal Generation	Sep 15, 2020	Action LocalizationRelation	CodeCode Available	1
Learning to Localize Actions from Moments	Aug 31, 2020	Action LocalizationTransfer Learning	CodeCode Available	1
Revisiting Anchor Mechanisms for Temporal Action Localization	Aug 22, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
Localizing the Common Action Among a Few Videos	Aug 13, 2020	Action Localization	CodeCode Available	1
Recognition of Instrument-Tissue Interactions in Endoscopic Videos via Action Triplets	Jul 10, 2020	Action LocalizationAction Recognition	CodeCode Available	1
1st place solution for AVA-Kinetics Crossover in AcitivityNet Challenge 2020	Jun 16, 2020	Action LocalizationRelation Network	CodeCode Available	1
Actor-Context-Actor Relation Network for Spatio-Temporal Action Localization	Jun 14, 2020	Action DetectionAction Localization	CodeCode Available	1
CBR-Net: Cascade Boundary Refinement Network for Action Detection: Submission to ActivityNet Challenge 2020 (Task 1)	Jun 13, 2020	Action DetectionAction Localization	CodeCode Available	1
Weakly-supervised Temporal Action Localization by Uncertainty Modeling	Jun 12, 2020	Action ClassificationAction Localization	CodeCode Available	1
Weakly-Supervised Action Localization by Generative Attention Modeling	Mar 27, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
SF-Net: Single-Frame Supervision for Temporal Action Localization	Mar 15, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
Bottom-Up Temporal Action Localization with Mutual Regularization	Feb 18, 2020	Action LocalizationTemporal Action Localization	CodeCode Available	1
Weakly Supervised Temporal Action Localization Using Deep Metric Learning	Jan 21, 2020	Action LocalizationMetric Learning	CodeCode Available	1
End-to-End Learning of Visual Representations from Uncurated Instructional Videos	Dec 13, 2019	Action LocalizationAction Recognition	CodeCode Available	1
Learning Sparse 2D Temporal Adjacent Networks for Temporal Action Localization	Dec 8, 2019	Action LocalizationTemporal Action Localization	CodeCode Available	1
Background Suppression Network for Weakly-supervised Temporal Action Localization	Nov 22, 2019	Action LocalizationTemporal Action Localization	CodeCode Available	1
HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips	Jun 7, 2019	Action LocalizationLong Video Retrieval (Background Removed)	CodeCode Available	1
AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions	May 23, 2017	Actin DetectionAction Detection	CodeCode Available	1
LLM-powered Query Expansion for Enhancing Boundary Prediction in Language-driven Action Localization	May 30, 2025	Action Localization	—Unverified	0
CLIP-AE: CLIP-assisted Cross-view Audio-Visual Enhancement for Unsupervised Temporal Action Localization	May 29, 2025	Action LocalizationInformation Retrieval	—Unverified	0
DeepConvContext: A Multi-Scale Approach to Timeseries Classification in Human Activity Recognition	May 27, 2025	Action LocalizationActivity Recognition	CodeCode Available	0

Show:10 25 50

← PrevPage 4 of 15Next →

No leaderboard results yet.