Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–280 of 280 papers

Title	Date	Tasks	Status
Unsupervised Video Summarization via Attention-Driven Adversarial Learning	Dec 24, 2019	Unsupervised Video SummarizationVideo Summarization	CodeCode Available
What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations	Feb 12, 2025	Text SummarizationVideo Summarization	CodeCode Available
Siamese Tracking with Lingual Object Constraints	Nov 23, 2020	ObjectObject Tracking	CodeCode Available
Spatio-Temporal Stability Analysis in Satellite Image Times Series	Oct 9, 2020	Feature EngineeringTime Series	CodeCode Available
Query-adaptive Video Summarization via Quality-aware Relevance Estimation	May 1, 2017	DiversityVideo Summarization	CodeCode Available
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward	Dec 29, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
Unsupervised Video Summarization With Adversarial LSTM Networks	Jul 1, 2017	Unsupervised Video SummarizationVideo Summarization	CodeCode Available
An Integrated Framework for Multi-Granular Explanation of Video Summarization	May 16, 2024	BenchmarkingPanoptic Segmentation	CodeCode Available
Video Summarization: Towards Entity-Aware Captions	Dec 1, 2023	Image CaptioningVideo Captioning	CodeCode Available
Integrate the temporal scheme for unsupervised video summarization via attention mechanism	Feb 26, 2025	Unsupervised Video SummarizationVideo Summarization	CodeCode Available
A Human-Annotated Video Dataset for Training and Evaluation of 360-Degree Video Summarization Methods	Jun 5, 2024	Video Summarization	CodeCode Available
ERA: Entity Relationship Aware Video Summarization with Wasserstein GAN	Sep 6, 2021	Unsupervised Video SummarizationVideo Summarization	CodeCode Available
Summarizing Videos with Attention	Dec 5, 2018	Video Summarization	CodeCode Available
Video Summarization using Deep Semantic Features	Sep 28, 2016	ClusteringVideo Summarization	CodeCode Available
Enhancing Video Summarization with Context Awareness	Apr 6, 2024	BenchmarkingInformativeness	CodeCode Available
DeVAn: Dense Video Annotation for Video-Language Models	Oct 8, 2023	RetrievalSentence	CodeCode Available
Cluster-based Video Summarization with Temporal Context Awareness	Apr 6, 2024	ClusteringUnsupervised Video Summarization	CodeCode Available
Temporal Tessellation: A Unified Approach for Video Analysis	Dec 21, 2016	Action DetectionVideo Captioning	CodeCode Available
Adaptive frame selection in two dimensional convolutional neural network action recognition	Dec 28, 2022	Action RecognitionVideo Summarization	CodeCode Available
CLIP-It! Language-Guided Video Summarization	Jul 1, 2021	Query-focused SummarizationQuery focused video summarization	CodeCode Available
A Stepwise, Label-based Approach for Improving the Adversarial Training in Unsupervised Video Summarization	Oct 21, 2019	BenchmarkingUnsupervised Video Summarization	CodeCode Available
Towards Practical and Efficient Long Video Summary	Apr 27, 2022	Video Summarization	CodeCode Available
Vis-DSS: An Open-Source toolkit for Visual Data Selection and Summarization	Sep 24, 2018	Active LearningVideo Summarization	CodeCode Available
A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from Video	Dec 4, 2023	Video Summarization	CodeCode Available
Rethinking the Evaluation of Video Summaries	Mar 27, 2019	Video SegmentationVideo Semantic Segmentation	CodeCode Available
APES: Audiovisual Person Search in Untrimmed Video	Jun 3, 2021	Person RetrievalPerson Search	CodeCode Available
An Integrated System for Spatio-Temporal Summarization of 360-degrees Videos	Dec 5, 2023	Saliency DetectionVideo Saliency Detection	CodeCode Available
Unsupervised video summarization framework using keyframe extraction and video skimming	Oct 10, 2019	ClusteringUnsupervised Video Summarization	CodeCode Available
Visual Question Answering: which investigated applications?	Mar 4, 2021	Image CaptioningQuestion Answering	CodeCode Available
UBiSS: A Unified Framework for Bimodal Semantic Summarization of Videos	Jun 24, 2024	TripletVideo Summarization	CodeCode Available

Show:10 25 50

← PrevPage 6 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified