Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 280 papers

Title	Date	Tasks	Status
Text Synopsis Generation for Egocentric Videos	May 8, 2020	Multi-Task LearningVideo Summarization	—Unverified
The Power of Subsampling in Submodular Maximization	Apr 6, 2021	Movie RecommendationVideo Summarization	—Unverified
TL;DW? Summarizing Instructional Videos with Task Relevance & Cross-Modal Saliency	Aug 14, 2022	ArticlesVideo Summarization	—Unverified
Transforming Multi-Concept Attention into Video Summarization	Jun 2, 2020	DiversityVideo Summarization	—Unverified
TRIM: A Self-Supervised Video Summarization Framework Maximizing Temporal Relative Information and Representativeness	Jun 25, 2025	Self-Supervised LearningSupervised Video Summarization	—Unverified
TriPSS: A Tri-Modal Keyframe Extraction Framework Using Perceptual, Structural, and Semantic Representations	Jun 3, 2025	RetrievalVideo Summarization	—Unverified
TruNet: Short Videos Generation from Long Videos via Story-Preserving Truncation	Oct 14, 2019	Highlight DetectionVideo Summarization	—Unverified
TVSum: Summarizing Web Videos Using Titles	Jun 1, 2015	DescriptiveImage Retrieval	—Unverified
Understanding the Predictability of Gesture Parameters from Speech and their Perceptual Importance	Oct 2, 2020	Video Summarization	—Unverified
Unsupervised Object-Level Video Summarization with Online Motion Auto-Encoder	Jan 2, 2018	ObjectUnsupervised Video Summarization	—Unverified
Unsupervised Transcript-assisted Video Summarization and Highlight Detection	May 29, 2025	Highlight DetectionReinforcement Learning (RL)	—Unverified
Unsupervised Video Summarization via Reinforcement Learning and a Trained Evaluator	Jul 5, 2024	reinforcement-learningReinforcement Learning	—Unverified
Unsupervised Video Summarization with a Convolutional Attentive Adversarial Network	May 24, 2021	Generative Adversarial NetworkUnsupervised Video Summarization	—Unverified
Use of Affective Visual Information for Summarization of Human-Centric Videos	Jul 8, 2021	Emotion RecognitionRetrieval	—Unverified
V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning	Apr 18, 2024	Text SummarizationVideo Summarization	—Unverified
Video Co-Summarization: Video Summarization by Visual Co-Occurrence	Jun 1, 2015	Video Summarization	—Unverified
Video Object Segmentation and Tracking: A Survey	Apr 19, 2019	Autonomous VehiclesObject	—Unverified
Video Skimming: Taxonomy and Comprehensive Survey	Sep 21, 2019	SurveyVideo Summarization	—Unverified
Video Summarization by Learning Submodular Mixtures of Objectives	Jun 1, 2015	Video Summarization	—Unverified
Video Summarization in a Multi-View Camera Network	Aug 1, 2016	Video Summarization	—Unverified
Video Summarization Overview	Oct 21, 2022	Video Summarization	—Unverified
Video Summarization: Study of various techniques	Jan 21, 2021	AllVideo Summarization	—Unverified
Video Summarization Techniques: A Comprehensive Review	Oct 6, 2024	Abstractive Text SummarizationExtractive Summarization	—Unverified
A Mobile Robot Generating Video Summaries of Seniors' Indoor Activities	Jan 30, 2019	Action RecognitionHuman Detection	—Unverified
Video Summarization through Reinforcement Learning with a 3D Spatio-Temporal U-Net	Jun 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Video Summarization Using Deep Neural Networks: A Survey	Jan 15, 2021	Deep LearningSurvey	—Unverified
Video Summarization using Denoising Diffusion Probabilistic Model	Dec 11, 2024	Denoisingmodel	—Unverified
Video Summarization Using Fully Convolutional Sequence Networks	May 26, 2018	RetrievalSegmentation	—Unverified
Video Summarization via Actionness Ranking	Mar 1, 2019	Video Summarization	—Unverified
Video Summarization with Attention-Based Encoder-Decoder Networks	Aug 31, 2017	DecoderSupervised Video Summarization	—Unverified
Video Summarization with Large Language Models	Apr 15, 2025	Large Language ModelVideo Summarization	—Unverified
Video-Teller: Enhancing Cross-Modal Generation with Fusion and Decoupling	Oct 8, 2023	Text GenerationVideo Summarization	—Unverified
Viewpoint-aware Video Summarization	Apr 9, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified
Visual Recognition by Counting Instances: A Multi-Instance Cardinality Potential Kernel	Feb 6, 2015	Activity RecognitionEvent Detection	—Unverified
Visual Summarization of Scholarly Videos using Word Embeddings and Keyphrase Extraction	Nov 25, 2019	Keyphrase ExtractionOptical Character Recognition	—Unverified
VSCAN: An Enhanced Video Summarization using Density-based Spatial Clustering	May 1, 2014	ClusteringVideo Summarization	—Unverified
Weakly Supervised Video Summarization by Hierarchical Reinforcement Learning	Jan 12, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Multi-view Metric Learning for Multi-view Video Summarization	May 25, 2014	ClusteringMetric Learning	—Unverified
Multi-View Surveillance Video Summarization via Joint Embedding and Sparse Optimization	Jun 9, 2017	Video Summarization	—Unverified
NEWSKVQA: Knowledge-Aware News Video Question Answering	Feb 8, 2022	Common Sense ReasoningManagement	—Unverified
NLP Driven Ensemble Based Automatic Subtitle Generation and Semantic Video Summarization Technique	Apr 22, 2019	speech-recognitionSpeech Recognition	—Unverified
Non-Monotone Submodular Maximization with Multiple Knapsacks in Static and Dynamic Settings	Nov 15, 2019	Video Summarization	—Unverified
Online Learnable Keyframe Extraction in Videos and its Application with Semantic Word Vector in Action Recognition	Sep 25, 2020	Action RecognitionGeneral Classification	—Unverified
Online Summarization via Submodular and Convex Optimization	Jul 1, 2017	Video Summarization	—Unverified
Pack and Detect: Fast Object Detection in Videos Using Region-of-Interest Packing	Sep 5, 2018	GPUObject	—Unverified
Parameter-free Video Segmentation for Vision and Language Understanding	Mar 3, 2025	Question AnsweringVideo Question Answering	—Unverified
Pegasus-v1 Technical Report	Apr 23, 2024	Language ModelingLanguage Modelling	—Unverified
Personalized Video Summarization by Multimodal Video Understanding	Nov 5, 2024	Unsupervised Video SummarizationVideo Summarization	—Unverified
Personalized Video Summarization using Text-Based Queries and Conditional Modeling	Aug 27, 2024	Video SummarizationWord Embeddings	—Unverified
Predicting Important Objects for Egocentric Video Summarization	May 18, 2015	Event DetectionVideo Summarization	—Unverified

Show:10 25 50

← PrevPage 4 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified