Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 280 papers

Title	Date	Tasks	Status
DeVAn: Dense Video Annotation for Video-Language Models	Oct 8, 2023	RetrievalSentence	CodeCode Available
Video-Teller: Enhancing Cross-Modal Generation with Fusion and Decoupling	Oct 8, 2023	Text GenerationVideo Summarization	—Unverified
Mr. HiSum: A Large-scale Dataset for Video Highlight Detection and Summarization	Sep 26, 2023	Video Summarization	—Unverified
Does Video Summarization Require Videos? Quantifying the Effectiveness of Language in Video Summarization	Sep 18, 2023	Data CompressionVideo Summarization	—Unverified
Saliency-based Video Summarization for Face Anti-spoofing	Aug 23, 2023	Face Anti-SpoofingFace Presentation Attack Detection	—Unverified
Self-Attention Based Generative Adversarial Networks For Unsupervised Video Summarization	Jul 16, 2023	Generative Adversarial NetworkUnsupervised Video Summarization	—Unverified
Query-based Video Summarization with Pseudo Label Supervision	Jul 4, 2023	Pseudo LabelVideo Summarization	—Unverified
Causal Video Summarizer for Video Exploration	Jul 4, 2023	DecoderVideo Summarization	—Unverified
Key Frame Extraction with Attention Based Deep Neural Networks	Jun 21, 2023	Video RetrievalVideo Summarization	—Unverified
Masked Autoencoder for Unsupervised Video Summarization	Jun 2, 2023	DecoderSelf-Supervised Learning	—Unverified
Motion-Based Sign Language Video Summarization using Curvature and Torsion	May 26, 2023	Video Summarization	—Unverified
Causalainer: Causal Explainer for Automatic Video Summarization	Apr 30, 2023	Video Summarization	—Unverified
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available
Learning to Summarize Videos by Contrasting Clips	Jan 12, 2023	Contrastive LearningUnsupervised Video Summarization	—Unverified
Adaptive frame selection in two dimensional convolutional neural network action recognition	Dec 28, 2022	Action RecognitionVideo Summarization	CodeCode Available
Role of Audio in Audio-Visual Video Summarization	Dec 2, 2022	RetrievalVideo Summarization	—Unverified
Video Summarization Overview	Oct 21, 2022	Video Summarization	—Unverified
TL;DW? Summarizing Instructional Videos with Task Relevance & Cross-Modal Saliency	Aug 14, 2022	ArticlesVideo Summarization	—Unverified
Multimodal Frame-Scoring Transformer for Video Summarization	Jul 5, 2022	Video Summarization	—Unverified
Multimodal Intent Discovery from Livestream Videos	Jul 1, 2022	Intent DiscoveryVideo Summarization	—Unverified
A Multi-stage deep architecture for summary generation of soccer videos	May 2, 2022	Sports AnalyticsVideo Summarization	—Unverified
Towards Practical and Efficient Long Video Summary	Apr 27, 2022	Video Summarization	CodeCode Available
Relational Reasoning Over Spatial-Temporal Graphs for Video Summarization	Apr 6, 2022	Graph ClassificationRelation	—Unverified
NEWSKVQA: Knowledge-Aware News Video Question Answering	Feb 8, 2022	Common Sense ReasoningManagement	—Unverified
Exploring Global Diversity and Local Context for Video Summarization	Jan 27, 2022	DiversityVideo Summarization	—Unverified
Joint Video Summarization and Moment Localization by Cross-Task Sample Transfer	Jan 1, 2022	Supervised Video SummarizationVideo Summarization	—Unverified
Fast Graph Sampling for Short Video Summarization using Gershgorin Disc Alignment	Oct 21, 2021	Graph SamplingVideo Summarization	—Unverified
A Stacking Ensemble Approach for Supervised Video Summarization	Sep 26, 2021	Supervised Video SummarizationVideo Summarization	—Unverified
Hierarchical Multimodal Transformer to Summarize Videos	Sep 22, 2021	Machine TranslationSupervised Video Summarization	—Unverified
ERA: Entity Relationship Aware Video Summarization with Wasserstein GAN	Sep 6, 2021	Unsupervised Video SummarizationVideo Summarization	CodeCode Available
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Use of Affective Visual Information for Summarization of Human-Centric Videos	Jul 8, 2021	Emotion RecognitionRetrieval	—Unverified
CLIP-It! Language-Guided Video Summarization	Jul 1, 2021	Query-focused SummarizationQuery focused video summarization	CodeCode Available
Video Summarization through Reinforcement Learning with a 3D Spatio-Temporal U-Net	Jun 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
APES: Audiovisual Person Search in Untrimmed Video	Jun 3, 2021	Person RetrievalPerson Search	CodeCode Available
Unsupervised Video Summarization with a Convolutional Attentive Adversarial Network	May 24, 2021	Generative Adversarial NetworkUnsupervised Video Summarization	—Unverified
AudioVisual Video Summarization	May 17, 2021	Video Summarization	—Unverified
DeepQAMVS: Query-Aware Hierarchical Pointer Networks for Multi-Video Summarization	May 13, 2021	DiversityVideo Summarization	—Unverified
Reconstructive Sequence-Graph Network for Video Summarization	May 10, 2021	Video Summarization	—Unverified
GPT2MVS: Generative Pre-trained Transformer-2 for Multi-modal Video Summarization	Apr 26, 2021	Video Summarization	CodeCode Available
The Power of Subsampling in Submodular Maximization	Apr 6, 2021	Movie RecommendationVideo Summarization	—Unverified
Distance Metric-Based Learning with Interpolated Latent Features for Location Classification in Endoscopy Image and Video	Mar 15, 2021	Anomaly DetectionFew-Shot Learning	—Unverified
Visual Question Answering: which investigated applications?	Mar 4, 2021	Image CaptioningQuestion Answering	CodeCode Available
Audiovisual Highlight Detection in Videos	Feb 11, 2021	Highlight DetectionObject Recognition	—Unverified
Efficient Video Summarization Framework using EEG and Eye-tracking Signals	Jan 27, 2021	EEGElectroencephalogram (EEG)	—Unverified
How Good is a Video Summary? A New Benchmarking Dataset and Evaluation Framework Towards Realistic Video Summarization	Jan 26, 2021	BenchmarkingSupervised Video Summarization	—Unverified
Video Summarization: Study of various techniques	Jan 21, 2021	AllVideo Summarization	—Unverified
Video Summarization Using Deep Neural Networks: A Survey	Jan 15, 2021	Deep LearningSurvey	—Unverified
Multiple Pairwise Ranking Networks for Personalized Video Summarization	Jan 1, 2021	Video Summarization	—Unverified
A New Action Recognition Framework for Video Highlights Summarization in Sporting Events	Dec 1, 2020	Action RecognitionTemporal Action Localization	—Unverified

Show:10 25 50

← PrevPage 3 of 6Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	PGL-SUM	F1-score (Canonical)	61	—	Unverified
5	M-AVS	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified