Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 280 papers

Title	Date	Tasks	Status	Score
SD-VSum: A Method and Dataset for Script-Driven Video Summarization	May 6, 2025	Video Summarization	CodeCode Available	5
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available	5
Multi-Stream Dynamic Video Summarization	Dec 1, 2018	Video Summarization	CodeCode Available	5
Query-adaptive Video Summarization via Quality-aware Relevance Estimation	May 1, 2017	DiversityVideo Summarization	CodeCode Available	5
A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from Video	Dec 4, 2023	Video Summarization	CodeCode Available	5
Does SpatioTemporal information benefit Two video summarization benchmarks?	Oct 4, 2024	Activity RecognitionVideo Summarization	CodeCode Available	5
Enhancing Video Summarization with Context Awareness	Apr 6, 2024	BenchmarkingInformativeness	CodeCode Available	5
Integrate the temporal scheme for unsupervised video summarization via attention mechanism	Feb 26, 2025	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	5
Iterative Projection and Matching: Finding Structure-preserving Representatives and Its Application to Computer Vision	Nov 29, 2018	Action RecognitionActive Learning	CodeCode Available	5
CLIP-It! Language-Guided Video Summarization	Jul 1, 2021	Query-focused SummarizationQuery focused video summarization	CodeCode Available	5
Temporal Tessellation: A Unified Approach for Video Analysis	Dec 21, 2016	Action DetectionVideo Captioning	CodeCode Available	5
ILS-SUMM: Iterated Local Search for Unsupervised Video Summarization	Dec 8, 2019	Metaheuristic OptimizationUnsupervised Video Summarization	CodeCode Available	5
Attention is all you need for Videos: Self-attention based Video Summarization using Universal Transformers	Jun 6, 2019	AllDense Video Captioning	—Unverified	0
Discovery of Shared Semantic Spaces for Multi-Scene Video Query and Summarization	Jul 27, 2015	Scene UnderstandingSemantic Similarity	—Unverified	0
Detecting Engagement in Egocentric Video	Apr 4, 2016	Video Summarization	—Unverified	0
A Survey on Recent Advances of Computer Vision Algorithms for Egocentric Video	Jan 12, 2015	Action DetectionActivity Detection	—Unverified	0
A Multi-stage deep architecture for summary generation of soccer videos	May 2, 2022	Sports AnalyticsVideo Summarization	—Unverified	0
Demystifying Multi-Faceted Video Summarization: Tradeoff Between Diversity,Representation, Coverage and Importance	Jan 3, 2019	DiversityVideo Summarization	—Unverified	0
DeepQAMVS: Query-Aware Hierarchical Pointer Networks for Multi-Video Summarization	May 13, 2021	DiversityVideo Summarization	—Unverified	0
Cycle-SUM: Cycle-consistent Adversarial LSTM Networks for Unsupervised Video Summarization	Apr 17, 2019	Unsupervised Video SummarizationVideo Summarization	—Unverified	0
A Survey on Patch-based Synthesis: GPU Implementation and Optimization	May 11, 2020	DenoisingGPU	—Unverified	0
A Memory Network Approach for Story-Based Temporal Summarization of 360Â° Videos	Jun 1, 2018	Video Summarization	—Unverified	0
CSTA: CNN-based Spatiotemporal Attention for Video Summarization	May 20, 2024	Supervised Video SummarizationVideo Summarization	—Unverified	0
Creating Summaries from User Videos	Jan 1, 2014	Video Summarization	—Unverified	0
Co-Regularized Deep Representations for Video Summarization	Jan 30, 2015	InformativenessVideo Summarization	—Unverified	0

Show:10 25 50

← PrevPage 4 of 12Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified