Temporal Sentence Grounding

Temporal sentence grounding (TSG) aims to locate a specific moment from an untrimmed video with a given natural language query. For this task, different levels of supervision are used. 1) Weak supervision: video-level action category set; 2) Semi-weak supervision: video-level action category set, and action annotations at several timestamps; 3) Full supervision: Action category and action interval annotations of all actions in untrimmed videos.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–43 of 43 papers

Title	Date	Tasks	Status
A Closer Look at Debiased Temporal Sentence Grounding in Videos: Dataset, Metric, and Approach	Mar 10, 2022	BenchmarkingSentence	—Unverified
You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos	Mar 14, 2023	SentenceTemporal Sentence Grounding	—Unverified
Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition	Nov 28, 2023	Action ClassificationAction Recognition	—Unverified
A Survey on Temporal Sentence Grounding in Videos	Sep 16, 2021	Action LocalizationBenchmarking	—Unverified
Constraint and Union for Partially-Supervised Temporal Sentence Grounding	Feb 20, 2023	SentenceTemporal Sentence Grounding	—Unverified
Context-aware Biaffine Localizing Network for Temporal Sentence Grounding	Mar 22, 2021	SentenceTemporal Sentence Grounding	—Unverified
Contrast-Unity for Partially-Supervised Temporal Sentence Grounding	Feb 18, 2025	Contrastive LearningDenoising	—Unverified
Diversified Augmentation with Domain Adaptation for Debiased Video Temporal Grounding	Jan 12, 2025	Data AugmentationDomain Adaptation	—Unverified
Exploring Motion and Appearance Information for Temporal Sentence Grounding	Jan 3, 2022	Objectobject-detection	—Unverified
Exploring Optical-Flow-Guided Motion and Detection-Based Appearance for Temporal Sentence Grounding	Mar 6, 2022	Objectobject-detection	—Unverified
Grounding-Prompter: Prompting LLM with Multimodal Information for Temporal Sentence Grounding in Long Videos	Dec 28, 2023	DenoisingIn-Context Learning	—Unverified
Hierarchical Local-Global Transformer for Temporal Sentence Grounding	Aug 31, 2022	SentenceTemporal Sentence Grounding	—Unverified
Learning to Focus on the Foreground for Temporal Sentence Grounding	Oct 1, 2022	SentenceTemporal Sentence Grounding	—Unverified
Memory-Guided Semantic Learning Network for Temporal Sentence Grounding	Jan 3, 2022	SentenceTemporal Sentence Grounding	—Unverified
Multi-Pair Temporal Sentence Grounding via Multi-Thread Knowledge Transfer Network	Dec 20, 2024	SentenceTemporal Sentence Grounding	—Unverified
Progressively Guide to Attend: An Iterative Alignment Framework for Temporal Sentence Grounding	Sep 14, 2021	SentenceTemporal Sentence Grounding	—Unverified
Reducing the Vision and Language Bias for Temporal Sentence Grounding	Jul 27, 2022	Information RetrievalMultimodal Reasoning	—Unverified
Rethinking the Video Sampling and Reasoning Strategies for Temporal Sentence Grounding	Jan 2, 2023	SentenceTemporal Sentence Grounding	—Unverified

Show:10 25 50

← PrevPage 2 of 2Next →

All datasets Charades-STA Ego4D-Goalstep

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeCafNet	R1@0.7	47.55	—	Unverified
2	AdaFocus (Full, MViT-Charades-Pretrain-feature, MMN model)	R1@0.7	38.6	—	Unverified
3	AdaFocus (Full, I3D-Charades-Pretrain-feature, MMN model)	R1@0.7	35.6	—	Unverified
4	MMN (Full, MViT-K400-Pretrain-feature, evaluated by AdaFocus)	R1@0.7	32.2	—	Unverified
5	MMN (Full, I3D-K400-Pretrain-feature, evaluated by AdaFocus)	R1@0.7	29.8	—	Unverified
6	AdaFocus (Weak, MViT-Charades-Pretrain-feature, CPL model)	R1@0.7	23.2	—	Unverified
7	AdaFocus (Weak, I3D-Charades-Pretrain-feature, CPL model)	R1@0.7	22.4	—	Unverified
8	CPL (Weak, MViT-K400-Pretrain-feature, evaluated by AdaFocus)	R1@0.7	21.8	—	Unverified
9	AdaFocus (Semi-weak, MViT-Charades-Pretrain-feature, D3G model)	R1@0.7	21.8	—	Unverified
10	AdaFocus (Semi-weak, I3D-Charades-Pretrain-feature, D3G model)	R1@0.7	21.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeCafNet-100%	R@1,IoU=0.3	23.2	—	Unverified
2	DeCafNet-50%	R@1,IoU=0.3	21.29	—	Unverified
3	VSLNet	R@1,IoU=0.3	11.7	—	Unverified