Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 280 papers

Title	Date	Tasks	Status	Hype
Towards Practical and Efficient Long Video Summary	Apr 27, 2022	Video Summarization	CodeCode Available	0
MHSCNet: A Multimodal Hierarchical Shot-aware Convolutional Network for Video Summarization	Apr 18, 2022	Video Summarization	CodeCode Available	1
Relational Reasoning Over Spatial-Temporal Graphs for Video Summarization	Apr 6, 2022	Graph ClassificationRelation	—Unverified	0
NEWSKVQA: Knowledge-Aware News Video Question Answering	Feb 8, 2022	Common Sense ReasoningManagement	—Unverified	0
Exploring Global Diversity and Local Context for Video Summarization	Jan 27, 2022	DiversityVideo Summarization	—Unverified	0
LTC-SUM: Lightweight Client-driven Personalized Video Summarization Framework Using 2D CNN	Jan 22, 2022	Video Summarization	CodeCode Available	1
Progressive Video Summarization via Multimodal Self-supervised Learning	Jan 7, 2022	Self-Supervised LearningSupervised Video Summarization	CodeCode Available	1
Joint Video Summarization and Moment Localization by Cross-Task Sample Transfer	Jan 1, 2022	Supervised Video SummarizationVideo Summarization	—Unverified	0
Video Joint Modelling Based on Hierarchical Transformer for Co-summarization	Dec 27, 2021	RetrievalSupervised Video Summarization	CodeCode Available	1
Combining Global and Local Attention with Positional Encoding for Video Summarization	Dec 1, 2021	Supervised Video SummarizationVideo Summarization	CodeCode Available	1
Fast Graph Sampling for Short Video Summarization using Gershgorin Disc Alignment	Oct 21, 2021	Graph SamplingVideo Summarization	—Unverified	0
IntentVizor: Towards Generic Query Guided Interactive Video Summarization	Sep 30, 2021	Video SummarizationVideo Understanding	CodeCode Available	1
A Stacking Ensemble Approach for Supervised Video Summarization	Sep 26, 2021	Supervised Video SummarizationVideo Summarization	—Unverified	0
Hierarchical Multimodal Transformer to Summarize Videos	Sep 22, 2021	Machine TranslationSupervised Video Summarization	—Unverified	0
ERA: Entity Relationship Aware Video Summarization with Wasserstein GAN	Sep 6, 2021	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	0
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Discriminative Latent Semantic Graph for Video Captioning	Aug 8, 2021	DecoderObject	CodeCode Available	1
Use of Affective Visual Information for Summarization of Human-Centric Videos	Jul 8, 2021	Emotion RecognitionRetrieval	—Unverified	0
CLIP-It! Language-Guided Video Summarization	Jul 1, 2021	Query-focused SummarizationQuery focused video summarization	CodeCode Available	0
Video Summarization through Reinforcement Learning with a 3D Spatio-Temporal U-Net	Jun 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Self-Attention Recurrent Summarization Network with Reinforcement Learning for Video Summarization Task	Jun 9, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Multimodal Summarization of User-Generated Videos	Jun 5, 2021	Video Summarization	CodeCode Available	1
APES: Audiovisual Person Search in Untrimmed Video	Jun 3, 2021	Person RetrievalPerson Search	CodeCode Available	0
Unsupervised Video Summarization via Multi-source Features	May 26, 2021	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	1
Unsupervised Video Summarization with a Convolutional Attentive Adversarial Network	May 24, 2021	Generative Adversarial NetworkUnsupervised Video Summarization	—Unverified	0

Show:10 25 50

← PrevPage 5 of 12Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	M-AVS	F1-score (Canonical)	61	—	Unverified
5	PGL-SUM	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified