Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 280 papers

Title	Date	Tasks	Status	Hype
R^2-Tuning: Efficient Image-to-Video Transfer Learning for Video Temporal Grounding	Apr 2, 2024	Highlight DetectionMoment Retrieval	—Unverified	0
R^2-Tuning: Efficient Image-to-Video Transfer Learning for Video Temporal Grounding	Mar 31, 2024	Highlight DetectionMoment Retrieval	—Unverified	0
FastPerson: Enhancing Video Learning through Effective Video Summarization that Preserves Linguistic and Visual Contexts	Mar 26, 2024	Video Summarization	—Unverified	0
Large Model based Sequential Keyframe Extraction for Video Summarization	Jan 10, 2024	Video Summarization	—Unverified	0
ANIM-400K: A Large-Scale Dataset for Automated End-To-End Dubbing of Video	Jan 10, 2024	Video Summarization	CodeCode Available	2
Previously on ... From Recaps to Story Summarization	Jan 1, 2024	Video Summarization	—Unverified	0
Beyond the Frame: Single and mutilple video summarization method with user-defined length	Dec 23, 2023	Video Summarization	—Unverified	0
Shot2Story20K: A New Benchmark for Comprehensive Understanding of Multi-shot Videos	Dec 16, 2023	Video Captioningvideo narration captioning	CodeCode Available	1
An Integrated System for Spatio-Temporal Summarization of 360-degrees Videos	Dec 5, 2023	Saliency DetectionVideo Saliency Detection	CodeCode Available	0
Facilitating the Production of Well-tailored Video Summaries for Sharing on Social Media	Dec 5, 2023	Video Summarization	—Unverified	0
A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from Video	Dec 4, 2023	Video Summarization	CodeCode Available	0
Video Summarization: Towards Entity-Aware Captions	Dec 1, 2023	Image CaptioningVideo Captioning	CodeCode Available	0
Scene Summarization: Clustering Scene Videos into Spatially Diverse Frames	Nov 28, 2023	ClusteringDiversity	—Unverified	0
Conditional Modeling Based Automatic Video Summarization	Nov 20, 2023	Video Summarization	—Unverified	0
Unsupervised Video Summarization via Iterative Training and Simplified GAN	Nov 7, 2023	Model SelectionUnsupervised Video Summarization	CodeCode Available	0
Dynamic Non-monotone Submodular Maximization	Nov 7, 2023	Data Summarizationfeature selection	—Unverified	0
DeVAn: Dense Video Annotation for Video-Language Models	Oct 8, 2023	RetrievalSentence	CodeCode Available	0
Video-Teller: Enhancing Cross-Modal Generation with Fusion and Decoupling	Oct 8, 2023	Text GenerationVideo Summarization	—Unverified	0
Mr. HiSum: A Large-scale Dataset for Video Highlight Detection and Summarization	Sep 26, 2023	Video Summarization	—Unverified	0
Does Video Summarization Require Videos? Quantifying the Effectiveness of Language in Video Summarization	Sep 18, 2023	Data CompressionVideo Summarization	—Unverified	0
Adopting Self-Supervised Learning into Unsupervised Video Summarization through Restorative Score.	Sep 11, 2023	Self-Supervised LearningUnsupervised Video Summarization	CodeCode Available	1
Adopting Self-Supervised Learning into Unsupervised Video Summarization through Restorative Score	Sep 11, 2023	Self-Supervised LearningUnsupervised Video Summarization	CodeCode Available	1
Saliency-based Video Summarization for Face Anti-spoofing	Aug 23, 2023	Face Anti-SpoofingFace Presentation Attack Detection	—Unverified	0
UniVTG: Towards Unified Video-Language Temporal Grounding	Jul 31, 2023	Highlight DetectionMoment Retrieval	CodeCode Available	2
Self-Attention Based Generative Adversarial Networks For Unsupervised Video Summarization	Jul 16, 2023	Generative Adversarial NetworkUnsupervised Video Summarization	—Unverified	0
EgoVLPv2: Egocentric Video-Language Pre-training with Fusion in the Backbone	Jul 11, 2023	Action RecognitionMoment Queries	CodeCode Available	1
Causal Video Summarizer for Video Exploration	Jul 4, 2023	DecoderVideo Summarization	—Unverified	0
Query-based Video Summarization with Pseudo Label Supervision	Jul 4, 2023	Pseudo LabelVideo Summarization	—Unverified	0
Key Frame Extraction with Attention Based Deep Neural Networks	Jun 21, 2023	Video RetrievalVideo Summarization	—Unverified	0
MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation of Videos	Jun 7, 2023	Text SummarizationVideo Summarization	CodeCode Available	1
Masked Autoencoder for Unsupervised Video Summarization	Jun 2, 2023	DecoderSelf-Supervised Learning	—Unverified	0
Motion-Based Sign Language Video Summarization using Curvature and Torsion	May 26, 2023	Video Summarization	—Unverified	0
Joint Moment Retrieval and Highlight Detection Via Natural Language Queries	May 8, 2023	DecoderHighlight Detection	CodeCode Available	1
Causalainer: Causal Explainer for Automatic Video Summarization	Apr 30, 2023	Video Summarization	—Unverified	0
Hierarchical Video-Moment Retrieval and Step-Captioning	Mar 29, 2023	Information RetrievalMoment Retrieval	CodeCode Available	1
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available	0
VideoXum: Cross-modal Visual and Textural Summarization of Videos	Mar 21, 2023	Text SummarizationVideo Summarization	CodeCode Available	1
Align and Attend: Multimodal Summarization with Dual Contrastive Losses	Mar 13, 2023	Extractive Text SummarizationSupervised Video Summarization	CodeCode Available	1
VideoSum: A Python Library for Surgical Video Summarization	Feb 15, 2023	Video Summarization	CodeCode Available	1
Learning to Summarize Videos by Contrasting Clips	Jan 12, 2023	Contrastive LearningUnsupervised Video Summarization	—Unverified	0
Adaptive frame selection in two dimensional convolutional neural network action recognition	Dec 28, 2022	Action RecognitionVideo Summarization	CodeCode Available	0
Role of Audio in Audio-Visual Video Summarization	Dec 2, 2022	RetrievalVideo Summarization	—Unverified	0
Contrastive Losses Are Natural Criteria for Unsupervised Video Summarization	Nov 18, 2022	Diversityimage-classification	CodeCode Available	1
Video Summarization Overview	Oct 21, 2022	Video Summarization	—Unverified	0
TL;DW? Summarizing Instructional Videos with Task Relevance & Cross-Modal Saliency	Aug 14, 2022	ArticlesVideo Summarization	—Unverified	0
Multimodal Frame-Scoring Transformer for Video Summarization	Jul 5, 2022	Video Summarization	—Unverified	0
Multimodal Intent Discovery from Livestream Videos	Jul 1, 2022	Intent DiscoveryVideo Summarization	—Unverified	0
Summarizing Videos using Concentrated Attention and Considering the Uniqueness and Diversity of the Video Frames	Jun 29, 2022	BenchmarkingDiversity	CodeCode Available	1
Egocentric Video-Language Pretraining	Jun 3, 2022	Action RecognitionContrastive Learning	CodeCode Available	2
A Multi-stage deep architecture for summary generation of soccer videos	May 2, 2022	Sports AnalyticsVideo Summarization	—Unverified	0

Show:10 25 50

← PrevPage 2 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified