Moment Retrieval

Moment retrieval can de defined as the task of "localizing moments in a video given a user query".

Description from: QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries

Image credit: QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 132 papers

Title	Date	Tasks	Status	Hype
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions	Dec 1, 2021	Moment RetrievalNatural Language Moment Retrieval	CodeCode Available	1
Detecting Moments and Highlights in Videos via Natural Language Queries	Dec 1, 2021	DecoderMoment Retrieval	CodeCode Available	1
Multi-scale 2D Representation Learning for weakly-supervised moment retrieval	Nov 4, 2021	Moment RetrievalRepresentation Learning	—Unverified	0
Coarse to Fine: Video Retrieval before Moment Localization	Oct 14, 2021	Moment RetrievalRetrieval	—Unverified	0
ViSeRet: A simple yet effective approach to moment retrieval via fine-grained video segmentation	Oct 11, 2021	Moment RetrievalRetrieval	—Unverified	0
CONQUER: Contextual Query-aware Ranking for Video Corpus Moment Retrieval	Sep 21, 2021	Corpus Video Moment RetrievalMoment Retrieval	CodeCode Available	1
MTVR: Multilingual Moment Retrieval in Videos	Jul 30, 2021	Moment RetrievalRetrieval	CodeCode Available	1
QVHighlights: Detecting Moments and Highlights in Videos via Natural Language Queries	Jul 20, 2021	Highlight DetectionMoment Retrieval	CodeCode Available	1
Video Moment Retrieval with Text Query Considering Many-to-Many Correspondence Using Potentially Relevant Pair	Jun 25, 2021	Moment RetrievalRetrieval	—Unverified	0
Multi-Modal Relational Graph for Cross-Modal Video Moment Retrieval	Jun 19, 2021	Cross-Modal RetrievalGraph Matching	—Unverified	0
Deconfounded Video Moment Retrieval with Causal Intervention	Jun 3, 2021	Moment RetrievalRetrieval	CodeCode Available	1
Video Corpus Moment Retrieval with Contrastive Learning	May 13, 2021	Contrastive LearningMoment Retrieval	CodeCode Available	1
Fast Video Moment Retrieval	Jan 1, 2021	Moment RetrievalRetrieval	—Unverified	0
VLG-Net: Video-Language Graph Matching Network for Video Grounding	Nov 19, 2020	Graph MatchingMoment Retrieval	CodeCode Available	1
Frame-wise Cross-modal Matching for Video Moment Retrieval	Sep 22, 2020	Boundary DetectionMoment Retrieval	CodeCode Available	1
Video Moment Retrieval via Natural Language Queries	Sep 4, 2020	Moment RetrievalNatural Language Queries	—Unverified	0
Uncovering Hidden Challenges in Query-Based Video Moment Retrieval	Sep 1, 2020	Moment RetrievalRetrieval	CodeCode Available	1
VLANet: Video-Language Alignment Network for Weakly-Supervised Video Moment Retrieval	Aug 24, 2020	Contrastive LearningMoment Retrieval	CodeCode Available	1
Text-based Localization of Moments in a Video Corpus	Aug 20, 2020	Moment RetrievalRetrieval	—Unverified	0
Generating Adjacency Matrix for Video Relocalization	Aug 19, 2020	Moment Retrieval	—Unverified	0
Regularized Two-Branch Proposal Networks for Weakly-Supervised Moment Retrieval in Videos	Aug 19, 2020	Moment RetrievalRetrieval	CodeCode Available	1
Graph Neural Network for Video Relocalization	Jul 20, 2020	Graph Neural NetworkMoment Retrieval	—Unverified	0
Language Guided Networks for Cross-modal Moment Retrieval	Jun 18, 2020	Moment RetrievalRetrieval	—Unverified	0
HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training	May 1, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval	Jan 24, 2020	Moment RetrievalRetrieval	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 6Next →

All datasets QVHighlights Charades-STA

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	R@1 IoU=0.5	66.1	—	Unverified
2	UnLoc-B	R@1 IoU=0.5	64.5	—	Unverified
3	DenoiseLoc	R@1 IoU=0.5	59.27	—	Unverified
4	SG-DETR (w/ PT)	mAP	58.8	—	Unverified
5	SG-DETR	mAP	54.1	—	Unverified
6	LLaVA-MR	mAP	52.73	—	Unverified
7	FlashVTG	mAP	52	—	Unverified
8	InternVideo2-6B	mAP	49.24	—	Unverified
9	CG-DETR (w/ PT)	mAP	47.97	—	Unverified
10	VideoLights-B-pt	mAP	47.94	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SG-DETR (w/ PT)	R@1 IoU=0.5	71.1	—	Unverified
2	LLaVA-MR	R@1 IoU=0.5	70.65	—	Unverified
3	FlashVTG	R@1 IoU=0.5	70.32	—	Unverified
4	SG-DETR	R@1 IoU=0.5	70.2	—	Unverified
5	InternVideo2-6B	R@1 IoU=0.5	70.03	—	Unverified
6	InternVideo2-1B	R@1 IoU=0.5	68.36	—	Unverified
7	VideoChat-T (FT)	R@1 IoU=0.5	67.1	—	Unverified
8	UniMD+Sync.	R@1 IoU=0.5	63.98	—	Unverified
9	LD-DETR	R@1 IoU=0.5	62.58	—	Unverified
10	VideoLights-B-pt	R@1 IoU=0.5	61.96	—	Unverified