Temporal Sentence Grounding

Temporal sentence grounding (TSG) aims to locate a specific moment from an untrimmed video with a given natural language query. For this task, different levels of supervision are used. 1) Weak supervision: video-level action category set; 2) Semi-weak supervision: video-level action category set, and action annotations at several timestamps; 3) Full supervision: Action category and action interval annotations of all actions in untrimmed videos.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–43 of 43 papers

Title	Date	Tasks	Status
Constraint and Union for Partially-Supervised Temporal Sentence Grounding	Feb 20, 2023	SentenceTemporal Sentence Grounding	—Unverified
Rethinking the Video Sampling and Reasoning Strategies for Temporal Sentence Grounding	Jan 2, 2023	SentenceTemporal Sentence Grounding	—Unverified
Weakly Supervised Temporal Sentence Grounding With Uncertainty-Guided Self-Training	Jan 1, 2023	Data AugmentationSentence	—Unverified
Learning to Focus on the Foreground for Temporal Sentence Grounding	Oct 1, 2022	SentenceTemporal Sentence Grounding	—Unverified
Hierarchical Local-Global Transformer for Temporal Sentence Grounding	Aug 31, 2022	SentenceTemporal Sentence Grounding	—Unverified
Reducing the Vision and Language Bias for Temporal Sentence Grounding	Jul 27, 2022	Information RetrievalMultimodal Reasoning	—Unverified
Towards Visual-Prompt Temporal Answering Grounding in Medical Instructional Video	Mar 13, 2022	Language ModellingQuestion Answering	—Unverified
A Closer Look at Debiased Temporal Sentence Grounding in Videos: Dataset, Metric, and Approach	Mar 10, 2022	BenchmarkingSentence	—Unverified
Exploring Optical-Flow-Guided Motion and Detection-Based Appearance for Temporal Sentence Grounding	Mar 6, 2022	Objectobject-detection	—Unverified
Temporal Sentence Grounding in Videos: A Survey and Future Directions	Jan 20, 2022	Moment RetrievalRetrieval	—Unverified
Memory-Guided Semantic Learning Network for Temporal Sentence Grounding	Jan 3, 2022	SentenceTemporal Sentence Grounding	—Unverified
Exploring Motion and Appearance Information for Temporal Sentence Grounding	Jan 3, 2022	Objectobject-detection	—Unverified
Towards Debiasing Temporal Sentence Grounding in Video	Nov 8, 2021	SentenceTemporal Sentence Grounding	—Unverified
A Survey on Temporal Sentence Grounding in Videos	Sep 16, 2021	Action LocalizationBenchmarking	—Unverified
Progressively Guide to Attend: An Iterative Alignment Framework for Temporal Sentence Grounding	Sep 14, 2021	SentenceTemporal Sentence Grounding	—Unverified
Context-aware Biaffine Localizing Network for Temporal Sentence Grounding	Mar 22, 2021	SentenceTemporal Sentence Grounding	—Unverified
A Closer Look at Temporal Sentence Grounding in Videos: Dataset and Metric	Jan 22, 2021	BenchmarkingSentence	CodeCode Available
Semantic Conditioned Dynamic Modulation for Temporal Sentence Grounding in Videos	Oct 31, 2019	SentenceTemporal Sentence Grounding	CodeCode Available

Show:10 25 50

← PrevPage 2 of 2Next →

All datasets Charades-STA Ego4D-Goalstep

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeCafNet	R1@0.7	47.55	—	Unverified
2	AdaFocus (Full, MViT-Charades-Pretrain-feature, MMN model)	R1@0.7	38.6	—	Unverified
3	AdaFocus (Full, I3D-Charades-Pretrain-feature, MMN model)	R1@0.7	35.6	—	Unverified
4	MMN (Full, MViT-K400-Pretrain-feature, evaluated by AdaFocus)	R1@0.7	32.2	—	Unverified
5	MMN (Full, I3D-K400-Pretrain-feature, evaluated by AdaFocus)	R1@0.7	29.8	—	Unverified
6	AdaFocus (Weak, MViT-Charades-Pretrain-feature, CPL model)	R1@0.7	23.2	—	Unverified
7	AdaFocus (Weak, I3D-Charades-Pretrain-feature, CPL model)	R1@0.7	22.4	—	Unverified
8	CPL (Weak, MViT-K400-Pretrain-feature, evaluated by AdaFocus)	R1@0.7	21.8	—	Unverified
9	AdaFocus (Semi-weak, MViT-Charades-Pretrain-feature, D3G model)	R1@0.7	21.8	—	Unverified
10	AdaFocus (Semi-weak, I3D-Charades-Pretrain-feature, D3G model)	R1@0.7	21.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeCafNet-100%	R@1,IoU=0.3	23.2	—	Unverified
2	DeCafNet-50%	R@1,IoU=0.3	21.29	—	Unverified
3	VSLNet	R@1,IoU=0.3	11.7	—	Unverified