Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 280 papers

Title	Date	Tasks	Status	Score
Towards Practical and Efficient Long Video Summary	Apr 27, 2022	Video Summarization	CodeCode Available	5
APES: Audiovisual Person Search in Untrimmed Video	Jun 3, 2021	Person RetrievalPerson Search	CodeCode Available	5
Temporal Tessellation: A Unified Approach for Video Analysis	Dec 21, 2016	Action DetectionVideo Captioning	CodeCode Available	5
UBiSS: A Unified Framework for Bimodal Semantic Summarization of Videos	Jun 24, 2024	TripletVideo Summarization	CodeCode Available	5
Summarizing Videos with Attention	Dec 5, 2018	Video Summarization	CodeCode Available	5
Siamese Tracking with Lingual Object Constraints	Nov 23, 2020	ObjectObject Tracking	CodeCode Available	5
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward	Dec 29, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Adaptive frame selection in two dimensional convolutional neural network action recognition	Dec 28, 2022	Action RecognitionVideo Summarization	CodeCode Available	5
Spatio-Temporal Stability Analysis in Satellite Image Times Series	Oct 9, 2020	Feature EngineeringTime Series	CodeCode Available	5
A Human-Annotated Video Dataset for Training and Evaluation of 360-Degree Video Summarization Methods	Jun 5, 2024	Video Summarization	CodeCode Available	5
An Integrated System for Spatio-Temporal Summarization of 360-degrees Videos	Dec 5, 2023	Saliency DetectionVideo Saliency Detection	CodeCode Available	5
Cluster-based Video Summarization with Temporal Context Awareness	Apr 6, 2024	ClusteringUnsupervised Video Summarization	CodeCode Available	5
SD-VSum: A Method and Dataset for Script-Driven Video Summarization	May 6, 2025	Video Summarization	CodeCode Available	5
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available	5
CLIP-It! Language-Guided Video Summarization	Jul 1, 2021	Query-focused SummarizationQuery focused video summarization	CodeCode Available	5
An Integrated Framework for Multi-Granular Explanation of Video Summarization	May 16, 2024	BenchmarkingPanoptic Segmentation	CodeCode Available	5
Query-adaptive Video Summarization via Quality-aware Relevance Estimation	May 1, 2017	DiversityVideo Summarization	CodeCode Available	5
Rethinking the Evaluation of Video Summaries	Mar 27, 2019	Video SegmentationVideo Semantic Segmentation	CodeCode Available	5
A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from Video	Dec 4, 2023	Video Summarization	CodeCode Available	5
ILS-SUMM: Iterated Local Search for Unsupervised Video Summarization	Dec 8, 2019	Metaheuristic OptimizationUnsupervised Video Summarization	CodeCode Available	5
Integrate the temporal scheme for unsupervised video summarization via attention mechanism	Feb 26, 2025	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	5
Does SpatioTemporal information benefit Two video summarization benchmarks?	Oct 4, 2024	Activity RecognitionVideo Summarization	CodeCode Available	5
ERA: Entity Relationship Aware Video Summarization with Wasserstein GAN	Sep 6, 2021	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	5
Enhancing Video Summarization with Context Awareness	Apr 6, 2024	BenchmarkingInformativeness	CodeCode Available	5
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 3 of 12Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified