Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 280 papers

Title	Date	Tasks	Status
Do Less, Get More: Streaming Submodular Maximization with Subsampling	Feb 20, 2018	Video Summarization	—Unverified
A Dataset and Preliminary Results for Umpire Pose Detection Using SVM Classification of Deep Features	Sep 11, 2018	Game of CricketVideo Summarization	—Unverified
A Framework towards Domain Specific Video Summarization	Sep 24, 2018	Video Summarization	—Unverified
A General Framework for Edited Video and Raw Video Summarization	Apr 24, 2019	Video Summarization	—Unverified
Agent-based Video Trimming	Dec 12, 2024	Highlight DetectionMoment Retrieval	—Unverified
A Graph-based Ranking Approach to Extract Key-frames for Static Video Summarization	Nov 29, 2019	Video Summarization	—Unverified
A Memory Network Approach for Story-based Temporal Summarization of 360° Videos	May 8, 2018	Video Summarization	—Unverified
A Memory Network Approach for Story-Based Temporal Summarization of 360Â° Videos	Jun 1, 2018	Video Summarization	—Unverified
A Multi-stage deep architecture for summary generation of soccer videos	May 2, 2022	Sports AnalyticsVideo Summarization	—Unverified
An Attention-Based Speaker Naming Method for Online Adaptation in Non-Fixed Scenarios	Dec 2, 2019	Video Summarization	—Unverified
An Enhanced Method For Evaluating Automatic Video Summaries	Jan 14, 2014	Video Summarization	—Unverified
A New Action Recognition Framework for Video Highlights Summarization in Sporting Events	Dec 1, 2020	Action RecognitionTemporal Action Localization	—Unverified
Submodular Maximization in Clean Linear Time	Jun 16, 2020	Movie RecommendationText Summarization	—Unverified
A Novel Approach for Robust Multi Human Action Recognition and Summarization based on 3D Convolutional Neural Networks	Jul 25, 2019	Action DetectionAction Recognition	—Unverified
A Novel Trustworthy Video Summarization Algorithm Through a Mixture of LoRA Experts	Mar 8, 2025	Mixture-of-ExpertsVideo Summarization	—Unverified
A Paradigm for Building Generalized Models of Human Image Perception Through Data Fusion	Jun 1, 2016	ImputationVideo Summarization	—Unverified
A Survey on Patch-based Synthesis: GPU Implementation and Optimization	May 11, 2020	DenoisingGPU	—Unverified
A Survey on Recent Advances of Computer Vision Algorithms for Egocentric Video	Jan 12, 2015	Action DetectionActivity Detection	—Unverified
Attention is all you need for Videos: Self-attention based Video Summarization using Universal Transformers	Jun 6, 2019	AllDense Video Captioning	—Unverified
Attentive monitoring of multiple video streams driven by a Bayesian foraging strategy	Oct 21, 2014	Video Summarization	—Unverified
Audiovisual Highlight Detection in Videos	Feb 11, 2021	Highlight DetectionObject Recognition	—Unverified
AudioVisual Video Summarization	May 17, 2021	Video Summarization	—Unverified
A Unified Multi-Faceted Video Summarization System	Apr 4, 2017	DiversityExtractive Summarization	—Unverified
Automatic Detection of Intro and Credits in Video using CLIP and Multihead Attention	Apr 13, 2025	CPUHighlight Detection	—Unverified
A Stacking Ensemble Approach for Supervised Video Summarization	Sep 26, 2021	Supervised Video SummarizationVideo Summarization	—Unverified
Beyond the Frame: Single and mutilple video summarization method with user-defined length	Dec 23, 2023	Video Summarization	—Unverified
Causalainer: Causal Explainer for Automatic Video Summarization	Apr 30, 2023	Video Summarization	—Unverified
Causal Video Summarizer for Video Exploration	Jul 4, 2023	DecoderVideo Summarization	—Unverified
CFSum: A Transformer-Based Multi-Modal Video Summarization Framework With Coarse-Fine Fusion	Mar 1, 2025	Video Summarization	—Unverified
CNN-Based Prediction of Frame-Level Shot Importance for Video Summarization	Aug 23, 2017	Video Summarization	—Unverified
Common Action Discovery and Localization in Unconstrained Videos	Oct 1, 2017	Object DiscoveryVideo Summarization	—Unverified
Compare and Select: Video Summarization with Multi-Agent Reinforcement Learning	Jul 29, 2020	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Comprehensive Video Understanding: Video summarization with content-based video recommender design	Oct 30, 2019	Action RecognitionData Augmentation	—Unverified
Conditional Modeling Based Automatic Video Summarization	Nov 20, 2023	Video Summarization	—Unverified
Co-Regularized Deep Representations for Video Summarization	Jan 30, 2015	InformativenessVideo Summarization	—Unverified
Creating Summaries from User Videos	Jan 1, 2014	Video Summarization	—Unverified
CSTA: CNN-based Spatiotemporal Attention for Video Summarization	May 20, 2024	Supervised Video SummarizationVideo Summarization	—Unverified
Cycle-SUM: Cycle-consistent Adversarial LSTM Networks for Unsupervised Video Summarization	Apr 17, 2019	Unsupervised Video SummarizationVideo Summarization	—Unverified
DeepQAMVS: Query-Aware Hierarchical Pointer Networks for Multi-Video Summarization	May 13, 2021	DiversityVideo Summarization	—Unverified
Demystifying Multi-Faceted Video Summarization: Tradeoff Between Diversity,Representation, Coverage and Importance	Jan 3, 2019	DiversityVideo Summarization	—Unverified
Detecting Engagement in Egocentric Video	Apr 4, 2016	Video Summarization	—Unverified
Discovery of Shared Semantic Spaces for Multi-Scene Video Query and Summarization	Jul 27, 2015	Scene UnderstandingSemantic Similarity	—Unverified
Diverse and Coherent Paragraph Generation from Images	Sep 3, 2018	DiversityImage Captioning	—Unverified
Stream Clipper: Scalable Submodular Maximization on Stream	Jun 1, 2016	Video Summarization	—Unverified
Subset Selection and Summarization in Sequential Data	Dec 1, 2017	DiversityTime Series	—Unverified
SumGraph: Video Summarization via Recursive Graph Modeling	Jul 17, 2020	Video Summarization	—Unverified
Summarization of User-Generated Sports Video by Using Deep Action Recognition Features	Sep 25, 2017	Action RecognitionTemporal Action Localization	—Unverified
Summary Transfer: Exemplar-based Subset Selection for Video Summarization	Mar 10, 2016	Video Summarization	—Unverified
SUSiNet: See, Understand and Summarize it	Dec 3, 2018	Action RecognitionSaliency Prediction	—Unverified
Temporally Coherent Bayesian Models for Entity Discovery in Videos by Tracklet Clustering	Sep 22, 2014	ClusteringVideo Summarization	—Unverified

Show:10 25 50

← PrevPage 3 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	M-AVS	F1-score (Canonical)	61	—	Unverified
5	PGL-SUM	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified