Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 280 papers

Title	Date	Tasks	Status
ElasticPlay: Interactive Video Summarization with Dynamic Time Budgets	Aug 23, 2017	Video SummarizationVideo Understanding	—Unverified
Hierarchical Recurrent Neural Network for Video Summarization	Apr 28, 2019	Video CaptioningVideo Summarization	—Unverified
Long-Term Identity-Aware Multi-Person Tracking for Surveillance Video Summarization	Apr 25, 2016	Face RecognitionVideo Summarization	—Unverified
Masked Autoencoder for Unsupervised Video Summarization	Jun 2, 2023	DecoderSelf-Supervised Learning	—Unverified
Motion-Based Sign Language Video Summarization using Curvature and Torsion	May 26, 2023	Video Summarization	—Unverified
How Local is the Local Diversity? Reinforcing Sequential Determinantal Point Processes with Dynamic Ground Sets for Supervised Video Summarization	Jul 11, 2018	DiversityPoint Processes	—Unverified
HSA-RNN: Hierarchical Structure-Adaptive RNN for Video Summarization	Jun 1, 2018	SegmentationVideo Summarization	—Unverified
Human Pose Estimation using Motion Priors and Ensemble Models	Jan 26, 2019	2D Human Pose Estimation3D Human Pose Tracking	—Unverified
CSTA: CNN-based Spatiotemporal Attention for Video Summarization	May 20, 2024	Supervised Video SummarizationVideo Summarization	—Unverified
Image Conditioned Keyframe-Based Video Summarization Using Object Detection	Sep 11, 2020	Objectobject-detection	—Unverified
EgoSonics: Generating Synchronized Audio for Silent Egocentric Videos	Jul 30, 2024	Audio SynthesisVideo Summarization	—Unverified
Cycle-SUM: Cycle-consistent Adversarial LSTM Networks for Unsupervised Video Summarization	Apr 17, 2019	Unsupervised Video SummarizationVideo Summarization	—Unverified
Efficient Video Summarization Framework using EEG and Eye-tracking Signals	Jan 27, 2021	EEGElectroencephalogram (EEG)	—Unverified
DeepQAMVS: Query-Aware Hierarchical Pointer Networks for Multi-Video Summarization	May 13, 2021	DiversityVideo Summarization	—Unverified
Beyond the Frame: Single and mutilple video summarization method with user-defined length	Dec 23, 2023	Video Summarization	—Unverified
Joint Summarization of Large-scale Collections of Web Images and Videos for Storyline Reconstruction	Jun 1, 2014	16kDiversity	—Unverified
Joint Video Summarization and Moment Localization by Cross-Task Sample Transfer	Jan 1, 2022	Supervised Video SummarizationVideo Summarization	—Unverified
Key Frame Extraction with Attention Based Deep Neural Networks	Jun 21, 2023	Video RetrievalVideo Summarization	—Unverified
A New Action Recognition Framework for Video Highlights Summarization in Sporting Events	Dec 1, 2020	Action RecognitionTemporal Action Localization	—Unverified
Large-Margin Determinantal Point Processes	Nov 6, 2014	Diversityparameter estimation	—Unverified
Large Model based Sequential Keyframe Extraction for Video Summarization	Jan 10, 2024	Video Summarization	—Unverified
Large-Scale Video Summarization Using Web-Image Priors	Jun 1, 2013	NavigateVideo Summarization	—Unverified
EDSNet: Efficient-DSNet for Video Summarization	Sep 23, 2024	Video Summarization	—Unverified
Learning to Summarize Videos by Contrasting Clips	Jan 12, 2023	Contrastive LearningUnsupervised Video Summarization	—Unverified
Dynamic Non-monotone Submodular Maximization	Nov 7, 2023	Data Summarizationfeature selection	—Unverified

Show:10 25 50

← PrevPage 5 of 12Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified