Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 280 papers

Title	Date	Tasks	Status
Improving Sequential Determinantal Point Processes for Supervised Video Summarization	Jul 28, 2018	DiversityPoint Processes	—Unverified
Cycle-SUM: Cycle-consistent Adversarial LSTM Networks for Unsupervised Video Summarization	Apr 17, 2019	Unsupervised Video SummarizationVideo Summarization	—Unverified
A Survey on Patch-based Synthesis: GPU Implementation and Optimization	May 11, 2020	DenoisingGPU	—Unverified
A Memory Network Approach for Story-Based Temporal Summarization of 360Â° Videos	Jun 1, 2018	Video Summarization	—Unverified
Image Conditioned Keyframe-Based Video Summarization Using Object Detection	Sep 11, 2020	Objectobject-detection	—Unverified
Human Pose Estimation using Motion Priors and Ensemble Models	Jan 26, 2019	2D Human Pose Estimation3D Human Pose Tracking	—Unverified
HSA-RNN: Hierarchical Structure-Adaptive RNN for Video Summarization	Jun 1, 2018	SegmentationVideo Summarization	—Unverified
Creating Summaries from User Videos	Jan 1, 2014	Video Summarization	—Unverified
How Local is the Local Diversity? Reinforcing Sequential Determinantal Point Processes with Dynamic Ground Sets for Supervised Video Summarization	Jul 11, 2018	DiversityPoint Processes	—Unverified
How Good is a Video Summary? A New Benchmarking Dataset and Evaluation Framework Towards Realistic Video Summarization	Jan 26, 2021	BenchmarkingSupervised Video Summarization	—Unverified
Highlight Detection With Pairwise Deep Ranking for First-Person Video Summarization	Jun 1, 2016	Highlight DetectionVideo Summarization	—Unverified
Co-Regularized Deep Representations for Video Summarization	Jan 30, 2015	InformativenessVideo Summarization	—Unverified
A Paradigm for Building Generalized Models of Human Image Perception Through Data Fusion	Jun 1, 2016	ImputationVideo Summarization	—Unverified
Hierarchical Recurrent Neural Network for Video Summarization	Apr 28, 2019	Video CaptioningVideo Summarization	—Unverified
Hierarchical Multimodal Transformer to Summarize Videos	Sep 22, 2021	Machine TranslationSupervised Video Summarization	—Unverified
Group Activity Recognition by Using Effective Multiple Modality Relation Representation With Temporal-Spatial Attention	Mar 10, 2020	Activity RecognitionAutonomous Vehicles	—Unverified
Conditional Modeling Based Automatic Video Summarization	Nov 20, 2023	Video Summarization	—Unverified
Key Frame Extraction with Attention Based Deep Neural Networks	Jun 21, 2023	Video RetrievalVideo Summarization	—Unverified
Language-Guided Self-Supervised Video Summarization Using Text Semantic Matching Considering the Diversity of the Video	May 14, 2024	DiversitySupervised Video Summarization	—Unverified
Large-Margin Determinantal Point Processes	Nov 6, 2014	Diversityparameter estimation	—Unverified
Large Model based Sequential Keyframe Extraction for Video Summarization	Jan 10, 2024	Video Summarization	—Unverified
Large-Scale Video Summarization Using Web-Image Priors	Jun 1, 2013	NavigateVideo Summarization	—Unverified
A Novel Trustworthy Video Summarization Algorithm Through a Mixture of LoRA Experts	Mar 8, 2025	Mixture-of-ExpertsVideo Summarization	—Unverified
Global-and-Local Relative Position Embedding for Unsupervised Video Summarization	Aug 1, 2020	Computational EfficiencyPosition	—Unverified
Generating Natural Language Summaries for Multimedia	May 1, 2012	Text GenerationVideo Classification	—Unverified

Show:10 25 50

← PrevPage 5 of 12Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	M-AVS	F1-score (Canonical)	61	—	Unverified
5	PGL-SUM	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified