Action Localization

Action Localization is finding the spatial and temporal co ordinates for an action in a video. An action localization model will identify which frame an action start and ends in video and return the x,y coordinates of an action. Further the co ordinates will change when the object performing action undergoes a displacement.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 369 papers

Title	Date	Tasks	Status	Hype
The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval	Jun 26, 2024	Action LocalizationMoment Retrieval	CodeCode Available	2
Test-Time Zero-Shot Temporal Action Localization	Apr 8, 2024	Action LocalizationLanguage Modelling	CodeCode Available	2
Temporal Action Localization with Enhanced Instant Discriminability	Sep 11, 2023	Action DetectionAction Localization	CodeCode Available	2
NMS Threshold matters for Ego4D Moment Queries -- 2nd place solution to the Ego4D Moment Queries Challenge 2023	Jul 5, 2023	Action LocalizationMoment Queries	CodeCode Available	2
Where a Strong Backbone Meets Strong Features -- ActionFormer for Ego4D Moment Queries Challenge	Nov 16, 2022	Action LocalizationMoment Queries	CodeCode Available	2
Structured Attention Composition for Temporal Action Localization	May 20, 2022	Action DetectionAction Localization	CodeCode Available	2
ActionFormer: Localizing Moments of Actions with Transformers	Feb 16, 2022	Action LocalizationAction Recognition	CodeCode Available	2
Zero-Shot Temporal Interaction Localization for Egocentric Videos	Jun 4, 2025	Action LocalizationHuman-Object Interaction Detection	CodeCode Available	1
TimeLoc: A Unified End-to-End Framework for Precise Timestamp Localization in Long Videos	Mar 9, 2025	Action LocalizationBoundary Detection	CodeCode Available	1
XRF V2: A Dataset for Action Summarization with Wi-Fi Signals, and IMUs in Phones, Watches, Earbuds, and Glasses	Jan 31, 2025	Action LocalizationAction Recognition	CodeCode Available	1
Temporal Action Localization with Cross Layer Task Decoupling and Refinement	Dec 12, 2024	Action ClassificationAction Localization	CodeCode Available	1
Open-Vocabulary Action Localization with Iterative Visual Prompting	Aug 30, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
Towards Completeness: A Generalizable Action Proposal Generator for Zero-Shot Temporal Action Localization	Aug 25, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
Probabilistic Vision-Language Representation for Weakly Supervised Temporal Action Localization	Aug 12, 2024	Action ClassificationAction Localization	CodeCode Available	1
HAT: History-Augmented Anchor Transformer for Online Temporal Action Localization	Aug 12, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
Enhancing Temporal Action Localization: Advanced S6 Modeling with Recurrent Mechanism	Jul 18, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
ActionSwitch: Class-agnostic Detection of Simultaneous Actions in Streaming Videos	Jul 17, 2024	Action DetectionAction Localization	CodeCode Available	1
Exploring Scalability of Self-Training for Open-Vocabulary Temporal Action Localization	Jul 9, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
Referring Atomic Video Action Recognition	Jul 2, 2024	Action LocalizationAction Recognition	CodeCode Available	1
EgoExo-Fitness: Towards Egocentric and Exocentric Full-Body Action Understanding	Jun 13, 2024	Action ClassificationAction Localization	CodeCode Available	1
SFMViT: SlowFast Meet ViT in Chaotic World	Apr 25, 2024	Action LocalizationVideo Understanding	CodeCode Available	1
UniAV: Unified Audio-Visual Perception for Multi-Task Video Event Localization	Apr 4, 2024	Action Localizationaudio-visual event localization	CodeCode Available	1
ASTRA: An Action Spotting TRAnsformer for Soccer Videos	Apr 2, 2024	Action LocalizationAction Spotting	CodeCode Available	1
Realigning Confidence with Temporal Saliency Information for Point-Level Weakly-Supervised Temporal Action Localization	Jan 1, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1
Revisiting Foreground and Background Separation in Weakly-supervised Temporal Action Localization: A Clustering-based Approach	Dec 21, 2023	Action LocalizationClassification	CodeCode Available	1
Temporal Action Localization for Inertial-based Human Activity Recognition	Nov 27, 2023	Action LocalizationActivity Recognition	CodeCode Available	1
GPT-4V in Wonderland: Large Multimodal Models for Zero-Shot Smartphone GUI Navigation	Nov 13, 2023	Action Localization	CodeCode Available	1
HR-Pro: Point-supervised Temporal Action Localization via Hierarchical Reliability Propagation	Aug 24, 2023	Action LocalizationTemporal Action Localization	CodeCode Available	1
DDG-Net: Discriminability-Driven Graph Network for Weakly-supervised Temporal Action Localization	Jul 31, 2023	Action LocalizationTemporal Action Localization	CodeCode Available	1
Actionness Inconsistency-guided Contrastive Learning for Weakly-supervised Temporal Action Localization	Jun 26, 2023	Action LocalizationContrastive Learning	CodeCode Available	1
Multi-Granularity Hand Action Detection	Jun 19, 2023	Action DetectionAction Localization	CodeCode Available	1
Proposal-Based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization	May 29, 2023	Action LocalizationMultiple Instance Learning	CodeCode Available	1
Boosting Weakly-Supervised Temporal Action Localization with Text Information	May 1, 2023	Action LocalizationSentence	CodeCode Available	1
Improving Weakly Supervised Temporal Action Localization by Bridging Train-Test Gap in Pseudo Labels	Apr 17, 2023	Action LocalizationPseudo Label	CodeCode Available	1
WEAR: An Outdoor Sports Dataset for Wearable and Egocentric Activity Recognition	Apr 11, 2023	Action DetectionAction Localization	CodeCode Available	1
TemporalMaxer: Maximize Temporal Context with only Max Pooling for Temporal Action Localization	Mar 16, 2023	Action LocalizationTemporal Action Localization	CodeCode Available	1
Chaotic World: A Large and Challenging Benchmark for Human Behavior Understanding in Chaotic Events	Jan 1, 2023	Action LocalizationPathfinder	CodeCode Available	1
Re^2TAL: Rewiring Pretrained Video Backbones for Reversible Temporal Action Localization	Nov 25, 2022	Action LocalizationGPU	CodeCode Available	1
SimOn: A Simple Framework for Online Temporal Action Localization	Nov 8, 2022	Action LocalizationTemporal Action Localization	CodeCode Available	1
EgoTaskQA: Understanding Human Tasks in Egocentric Videos	Oct 8, 2022	Action Localizationcounterfactual	CodeCode Available	1
Entity-aware and Motion-aware Transformers for Language-driven Action Localization in Videos	May 12, 2022	Action LocalizationRepresentation Learning	CodeCode Available	1
Convex Combination Consistency between Neighbors for Weakly-supervised Action Localization	May 1, 2022	Action LocalizationData Augmentation	CodeCode Available	1
E^2TAD: An Energy-Efficient Tracking-based Action Detector	Apr 9, 2022	Action DetectionAction Localization	CodeCode Available	1
TALLFormer: Temporal Action Localization with a Long-memory Transformer	Apr 4, 2022	Action LocalizationAction Recognition	CodeCode Available	1
Fine-grained Temporal Contrastive Learning for Weakly-supervised Temporal Action Localization	Mar 31, 2022	Action LocalizationClassification	CodeCode Available	1
Unsupervised Pre-training for Temporal Action Localization Tasks	Mar 25, 2022	Action LocalizationContrastive Learning	CodeCode Available	1
OpenTAL: Towards Open Set Temporal Action Localization	Mar 10, 2022	Action ClassificationAction Localization	CodeCode Available	1
Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation	Mar 6, 2022	Action LocalizationPseudo Label	CodeCode Available	1
Everything at Once - Multi-Modal Fusion Transformer for Video Retrieval	Jan 1, 2022	Action LocalizationRetrieval	CodeCode Available	1
Set-Supervised Action Learning in Procedural Task Videos via Pairwise Order Consistency	Jan 1, 2022	Action LocalizationAction Segmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 8Next →

No leaderboard results yet.