Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 280 papers

Title	Date	Tasks	Status
"Previously on ..." From Recaps to Story Summarization	May 19, 2024	Video Summarization	—Unverified
Previously on ... From Recaps to Story Summarization	Jan 1, 2024	Video Summarization	—Unverified
Prompts to Summaries: Zero-Shot Language-Guided Video Summarization	Jun 12, 2025	GPUQuery focused video summarization	—Unverified
Query-Aware Sparse Coding for Multi-Video Summarization	Jul 13, 2017	Video Summarization	—Unverified
Query-based Video Summarization with Pseudo Label Supervision	Jul 4, 2023	Pseudo LabelVideo Summarization	—Unverified
Query-centric Audio-Visual Cognition Network for Moment Retrieval, Segmentation and Step-Captioning	Dec 18, 2024	Moment RetrievalMulti-Task Learning	—Unverified
Query-Conditioned Three-Player Adversarial Network for Video Summarization	Jul 17, 2018	Generative Adversarial NetworkVideo Summarization	—Unverified
Query-Focused Extractive Video Summarization	Jul 18, 2016	Query focused video summarizationVideo Summarization	—Unverified
Query-Focused Video Summarization: Dataset, Evaluation, and A Memory Network Based Approach	Jul 16, 2017	Query focused video summarizationVideo Summarization	—Unverified
Query Twice: Dual Mixture Attention Meta Learning for Video Summarization	Aug 19, 2020	Meta-LearningSupervised Video Summarization	—Unverified
R^2-Tuning: Efficient Image-to-Video Transfer Learning for Video Temporal Grounding	Apr 2, 2024	Highlight DetectionMoment Retrieval	—Unverified
R^2-Tuning: Efficient Image-to-Video Transfer Learning for Video Temporal Grounding	Mar 31, 2024	Highlight DetectionMoment Retrieval	—Unverified
Realistic Video Summarization through VISIOCITY: A New Benchmark and Evaluation Framework	Jul 29, 2020	BenchmarkingVideo Summarization	—Unverified
Realizing Video Summarization from the Path of Language-based Semantic Understanding	Oct 6, 2024	Mixture-of-ExpertsVideo Generation	—Unverified
Real-time Video Summarization on Commodity Hardware	Jan 26, 2019	Video Summarization	—Unverified
Recognizing Micro-Actions and Reactions From Paired Egocentric Videos	Jun 1, 2016	Video Summarization	—Unverified
Reconstructive Sequence-Graph Network for Video Summarization	May 10, 2021	Video Summarization	—Unverified
REGen: Multimodal Retrieval-Embedded Generation for Long-to-Short Video Editing	May 24, 2025	Language ModelingLanguage Modelling	—Unverified
Reinforcement Learning for Ultrasound Image Analysis A Comprehensive Review of Advances and Applications	Feb 20, 2025	Decision MakingDeep Reinforcement Learning	—Unverified
Relational Reasoning Over Spatial-Temporal Graphs for Video Summarization	Apr 6, 2022	Graph ClassificationRelation	—Unverified
Representative Selection for Big Data via Sparse Graph and Geodesic Grassmann Manifold Distance	May 7, 2014	ClusteringVideo Summarization	—Unverified
Retrospective Encoders for Video Summarization	Sep 1, 2018	Metric LearningVideo Summarization	—Unverified
Role of Audio in Audio-Visual Video Summarization	Dec 2, 2022	RetrievalVideo Summarization	—Unverified
Saliency-based Video Summarization for Face Anti-spoofing	Aug 23, 2023	Face Anti-SpoofingFace Presentation Attack Detection	—Unverified
SalSum: Saliency-based Video Summarization using Generative Adversarial Networks	Nov 20, 2020	Generative Adversarial NetworkVideo Summarization	—Unverified
Scaling Submodular Maximization via Pruned Submodularity Graphs	Jun 1, 2016	Video Summarization	—Unverified
Scaling Up Video Summarization Pretraining with Large Language Models	Apr 4, 2024	Video AlignmentVideo Summarization	—Unverified
Scene Summarization: Clustering Scene Videos into Spatially Diverse Frames	Nov 28, 2023	ClusteringDiversity	—Unverified
Segmentation of Bleeding Regions in Wireless Capsule Endoscopy Images an Approach for inside Capsule Video Summarization	Feb 21, 2018	Video Summarization	—Unverified
Self-Attention Based Generative Adversarial Networks For Unsupervised Video Summarization	Jul 16, 2023	Generative Adversarial NetworkUnsupervised Video Summarization	—Unverified
Semantics for Large-Scale Multimedia: New Challenges for NLP	Jun 1, 2014	Active LearningInformation Retrieval	—Unverified
Semantic Video Trailers	Sep 7, 2016	Video Summarization	—Unverified
Sequence-to-Segment Networks for Segment Detection	Dec 1, 2018	DecoderTemporal Action Proposal Generation	—Unverified
Show and Recall: Learning What Makes Videos Memorable	Jul 17, 2017	Video Summarization	—Unverified
Distance Metric-Based Learning with Interpolated Latent Features for Location Classification in Endoscopy Image and Video	Mar 15, 2021	Anomaly DetectionFew-Shot Learning	—Unverified
Story-Driven Summarization for Egocentric Video	Jun 1, 2013	ArticlesDiversity	—Unverified
Iterative Projection and Matching: Finding Structure-preserving Representatives and Its Application to Computer Vision	Nov 29, 2018	Action RecognitionActive Learning	CodeCode Available
Multi-Stream Dynamic Video Summarization	Dec 1, 2018	Video Summarization	CodeCode Available
Does SpatioTemporal information benefit Two video summarization benchmarks?	Oct 4, 2024	Activity RecognitionVideo Summarization	CodeCode Available
Your Interest, Your Summaries: Query-Focused Long Video Summarization	Oct 17, 2024	Query focused video summarizationVideo Summarization	CodeCode Available
SD-VSum: A Method and Dataset for Script-Driven Video Summarization	May 6, 2025	Video Summarization	CodeCode Available
Discriminative Feature Learning for Unsupervised Video Summarization	Nov 24, 2018	Supervised Video SummarizationUnsupervised Video Summarization	CodeCode Available
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
ILS-SUMM: Iterated Local Search for Unsupervised Video Summarization	Dec 8, 2019	Metaheuristic OptimizationUnsupervised Video Summarization	CodeCode Available
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available
Weakly-supervised Video Summarization using Variational Encoder-Decoder and Web Prior	Sep 1, 2018	DecoderSaliency Prediction	CodeCode Available
Video Summarization with Long Short-term Memory	May 26, 2016	Domain AdaptationStructured Prediction	CodeCode Available
Unsupervised Video Summarization via Iterative Training and Simplified GAN	Nov 7, 2023	Model SelectionUnsupervised Video Summarization	CodeCode Available
GPT2MVS: Generative Pre-trained Transformer-2 for Multi-modal Video Summarization	Apr 26, 2021	Video Summarization	CodeCode Available
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 5 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified