Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 280 papers

Title	Date	Tasks	Status	Score
Weakly-supervised Video Summarization using Variational Encoder-Decoder and Web Prior	Sep 1, 2018	DecoderSaliency Prediction	CodeCode Available	5
APES: Audiovisual Person Search in Untrimmed Video	Jun 3, 2021	Person RetrievalPerson Search	CodeCode Available	5
What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations	Feb 12, 2025	Text SummarizationVideo Summarization	CodeCode Available	5
Your Interest, Your Summaries: Query-Focused Long Video Summarization	Oct 17, 2024	Query focused video summarizationVideo Summarization	CodeCode Available	5
GPT2MVS: Generative Pre-trained Transformer-2 for Multi-modal Video Summarization	Apr 26, 2021	Video Summarization	CodeCode Available	5
Vis-DSS: An Open-Source toolkit for Visual Data Selection and Summarization	Sep 24, 2018	Active LearningVideo Summarization	CodeCode Available	5
Video Summarization using Deep Semantic Features	Sep 28, 2016	ClusteringVideo Summarization	CodeCode Available	5
Adaptive frame selection in two dimensional convolutional neural network action recognition	Dec 28, 2022	Action RecognitionVideo Summarization	CodeCode Available	5
Video Summarization with Long Short-term Memory	May 26, 2016	Domain AdaptationStructured Prediction	CodeCode Available	5
A Human-Annotated Video Dataset for Training and Evaluation of 360-Degree Video Summarization Methods	Jun 5, 2024	Video Summarization	CodeCode Available	5
Video Summarization: Towards Entity-Aware Captions	Dec 1, 2023	Image CaptioningVideo Captioning	CodeCode Available	5
Visual Question Answering: which investigated applications?	Mar 4, 2021	Image CaptioningQuestion Answering	CodeCode Available	5
DeVAn: Dense Video Annotation for Video-Language Models	Oct 8, 2023	RetrievalSentence	CodeCode Available	5
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Unsupervised Video Summarization via Iterative Training and Simplified GAN	Nov 7, 2023	Model SelectionUnsupervised Video Summarization	CodeCode Available	5
Cluster-based Video Summarization with Temporal Context Awareness	Apr 6, 2024	ClusteringUnsupervised Video Summarization	CodeCode Available	5
Unsupervised Video Summarization via Attention-Driven Adversarial Learning	Dec 24, 2019	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	5
Towards Practical and Efficient Long Video Summary	Apr 27, 2022	Video Summarization	CodeCode Available	5
ERA: Entity Relationship Aware Video Summarization with Wasserstein GAN	Sep 6, 2021	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	5
An Integrated Framework for Multi-Granular Explanation of Video Summarization	May 16, 2024	BenchmarkingPanoptic Segmentation	CodeCode Available	5
Siamese Tracking with Lingual Object Constraints	Nov 23, 2020	ObjectObject Tracking	CodeCode Available	5
Spatio-Temporal Stability Analysis in Satellite Image Times Series	Oct 9, 2020	Feature EngineeringTime Series	CodeCode Available	5
Summarizing Videos with Attention	Dec 5, 2018	Video Summarization	CodeCode Available	5
UBiSS: A Unified Framework for Bimodal Semantic Summarization of Videos	Jun 24, 2024	TripletVideo Summarization	CodeCode Available	5
Rethinking the Evaluation of Video Summaries	Mar 27, 2019	Video SegmentationVideo Semantic Segmentation	CodeCode Available	5
SD-VSum: A Method and Dataset for Script-Driven Video Summarization	May 6, 2025	Video Summarization	CodeCode Available	5
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available	5
Multi-Stream Dynamic Video Summarization	Dec 1, 2018	Video Summarization	CodeCode Available	5
Query-adaptive Video Summarization via Quality-aware Relevance Estimation	May 1, 2017	DiversityVideo Summarization	CodeCode Available	5
A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from Video	Dec 4, 2023	Video Summarization	CodeCode Available	5
Does SpatioTemporal information benefit Two video summarization benchmarks?	Oct 4, 2024	Activity RecognitionVideo Summarization	CodeCode Available	5
Enhancing Video Summarization with Context Awareness	Apr 6, 2024	BenchmarkingInformativeness	CodeCode Available	5
Integrate the temporal scheme for unsupervised video summarization via attention mechanism	Feb 26, 2025	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	5
Iterative Projection and Matching: Finding Structure-preserving Representatives and Its Application to Computer Vision	Nov 29, 2018	Action RecognitionActive Learning	CodeCode Available	5
CLIP-It! Language-Guided Video Summarization	Jul 1, 2021	Query-focused SummarizationQuery focused video summarization	CodeCode Available	5
Temporal Tessellation: A Unified Approach for Video Analysis	Dec 21, 2016	Action DetectionVideo Captioning	CodeCode Available	5
ILS-SUMM: Iterated Local Search for Unsupervised Video Summarization	Dec 8, 2019	Metaheuristic OptimizationUnsupervised Video Summarization	CodeCode Available	5
Attention is all you need for Videos: Self-attention based Video Summarization using Universal Transformers	Jun 6, 2019	AllDense Video Captioning	—Unverified	0
Discovery of Shared Semantic Spaces for Multi-Scene Video Query and Summarization	Jul 27, 2015	Scene UnderstandingSemantic Similarity	—Unverified	0
Detecting Engagement in Egocentric Video	Apr 4, 2016	Video Summarization	—Unverified	0
A Survey on Recent Advances of Computer Vision Algorithms for Egocentric Video	Jan 12, 2015	Action DetectionActivity Detection	—Unverified	0
A Multi-stage deep architecture for summary generation of soccer videos	May 2, 2022	Sports AnalyticsVideo Summarization	—Unverified	0
Demystifying Multi-Faceted Video Summarization: Tradeoff Between Diversity,Representation, Coverage and Importance	Jan 3, 2019	DiversityVideo Summarization	—Unverified	0
DeepQAMVS: Query-Aware Hierarchical Pointer Networks for Multi-Video Summarization	May 13, 2021	DiversityVideo Summarization	—Unverified	0
Cycle-SUM: Cycle-consistent Adversarial LSTM Networks for Unsupervised Video Summarization	Apr 17, 2019	Unsupervised Video SummarizationVideo Summarization	—Unverified	0
A Survey on Patch-based Synthesis: GPU Implementation and Optimization	May 11, 2020	DenoisingGPU	—Unverified	0
A Memory Network Approach for Story-Based Temporal Summarization of 360Â° Videos	Jun 1, 2018	Video Summarization	—Unverified	0
CSTA: CNN-based Spatiotemporal Attention for Video Summarization	May 20, 2024	Supervised Video SummarizationVideo Summarization	—Unverified	0
Creating Summaries from User Videos	Jan 1, 2014	Video Summarization	—Unverified	0
Co-Regularized Deep Representations for Video Summarization	Jan 30, 2015	InformativenessVideo Summarization	—Unverified	0

Show:10 25 50

← PrevPage 2 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified