Temporal Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 153 papers

Title	Date	Tasks	Status	Hype	Score
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning	Mar 17, 2025	Grounded Video Question AnsweringQuestion Answering	CodeCode Available	3	5
Number it: Temporal Grounding Videos like Flipping Manga	Nov 15, 2024	Highlight DetectionMoment Retrieval	CodeCode Available	2	5
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding	Jun 11, 2024	Action UnderstandingDiversity	CodeCode Available	2	5
VideoMolmo: Spatio-Temporal Grounding Meets Pointing	Jun 5, 2025	Autonomous DrivingAutonomous Navigation	CodeCode Available	2	5
TimeChat: A Time-sensitive Multimodal Large Language Model for Long Video Understanding	Dec 4, 2023	Dense CaptioningHighlight Detection	CodeCode Available	2	5
MINERVA: Evaluating Complex Video Reasoning	May 1, 2025	BenchmarkingTemporal Localization	CodeCode Available	2	5
TimeMarker: A Versatile Video-LLM for Long and Short Video Understanding with Superior Temporal Localization Ability	Nov 27, 2024	Temporal LocalizationVideo Understanding	CodeCode Available	2	5
Crab: A Unified Audio-Visual Scene Understanding Model with Explicit Cooperation	Mar 17, 2025	Data InteractionScene Understanding	CodeCode Available	2	5
LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding	Jan 14, 2025	Feature CompressionLanguage Modeling	CodeCode Available	2	5
LITA: Language Instructed Temporal-Localization Assistant	Mar 27, 2024	Instruction FollowingTemporal Localization	CodeCode Available	2	5
Egocentric Video-Language Pretraining	Jun 3, 2022	Action RecognitionContrastive Learning	CodeCode Available	2	5
Multi-Task Learning of Object State Changes from Uncurated Videos	Nov 24, 2022	Multi-Task LearningObject	CodeCode Available	1	5
FineAction: A Fine-Grained Video Dataset for Temporal Action Localization	May 24, 2021	Action DetectionAction Localization	CodeCode Available	1	5
MAC: Mining Activity Concepts for Language-based Temporal Localization	Nov 21, 2018	Language-Based Temporal LocalizationTemporal Localization	CodeCode Available	1	5
Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time	Jul 1, 2024	AUDIO-VISUAL QUESTION ANSWERING (MUSIC-AVQA-v2.0)Fact Checking	CodeCode Available	1	5
OpenTAL: Towards Open Set Temporal Action Localization	Mar 10, 2022	Action ClassificationAction Localization	CodeCode Available	1	5
Boundary-sensitive Pre-training for Temporal Localization in Videos	Nov 21, 2020	Action ClassificationClassification	CodeCode Available	1	5
End-to-End Semi-Supervised Learning for Video Action Detection	Mar 8, 2022	Action DetectionClassification Consistency	CodeCode Available	1	5
DisTime: Distribution-based Time Representation for Video Large Language Models	May 30, 2025	Temporal LocalizationVideo Understanding	CodeCode Available	1	5
CityFlow-NL: Tracking and Retrieval of Vehicles at City Scale by Natural Language Descriptions	Jan 12, 2021	Multi-Object TrackingObject Tracking	CodeCode Available	1	5
Dense-Caption Matching and Frame-Selection Gating for Temporal Localization in VideoQA	May 13, 2020	Image CaptioningMulti-Label Classification	CodeCode Available	1	5
Knowing Your Target: Target-Aware Transformer Makes Better Spatio-Temporal Video Grounding	Feb 16, 2025	AttributeObject	CodeCode Available	1	5
Few-Shot Temporal Action Localization with Query Adaptive Transformer	Oct 20, 2021	Action LocalizationAction Segmentation	CodeCode Available	1	5
Explore-And-Match: Bridging Proposal-Based and Proposal-Free With Transformer for Sentence Grounding in Videos	Jan 25, 2022	Natural Language QueriesSentence	CodeCode Available	1	5
Audio-Visual Event Localization in Unconstrained Videos	Mar 23, 2018	audio-visual event localizationTemporal Localization	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 7Next →

No leaderboard results yet.