Video Summarization

Video Summarization aims to generate a short synopsis that summarizes the video content by selecting its most informative and important parts. The produced summary is usually composed of a set of representative video frames (a.k.a. video key-frames), or video fragments (a.k.a. video key-fragments) that have been stitched in chronological order to form a shorter video. The former type of a video summary is known as video storyboard, and the latter type is known as video skim.

Source: Video Summarization Using Deep Neural Networks: A Survey Image credit: iJRASET

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 280 papers

Title	Date	Tasks	Status	Hype
Online Learnable Keyframe Extraction in Videos and its Application with Semantic Word Vector in Action Recognition	Sep 25, 2020	Action RecognitionGeneral Classification	—Unverified	0
Exploring global diverse attention via pairwise temporal relation for video summarization	Sep 23, 2020	DecoderRelation	—Unverified	0
Multi-modal Summarization for Video-containing Documents	Sep 17, 2020	Question AnsweringVideo Summarization	CodeCode Available	1
Image Conditioned Keyframe-Based Video Summarization Using Object Detection	Sep 11, 2020	Objectobject-detection	—Unverified	0
Query Twice: Dual Mixture Attention Meta Learning for Video Summarization	Aug 19, 2020	Meta-LearningSupervised Video Summarization	—Unverified	0
Global-and-Local Relative Position Embedding for Unsupervised Video Summarization	Aug 1, 2020	Computational EfficiencyPosition	—Unverified	0
Compare and Select: Video Summarization with Multi-Agent Reinforcement Learning	Jul 29, 2020	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Realistic Video Summarization through VISIOCITY: A New Benchmark and Evaluation Framework	Jul 29, 2020	BenchmarkingVideo Summarization	—Unverified	0
SumGraph: Video Summarization via Recursive Graph Modeling	Jul 17, 2020	Video Summarization	—Unverified	0
Submodular Maximization in Clean Linear Time	Jun 16, 2020	Movie RecommendationText Summarization	—Unverified	0
Transforming Multi-Concept Attention into Video Summarization	Jun 2, 2020	DiversityVideo Summarization	—Unverified	0
Ultrasound Video Summarization using Deep Reinforcement Learning	May 19, 2020	Deep Reinforcement LearningDiagnostic	CodeCode Available	1
A Survey on Patch-based Synthesis: GPU Implementation and Optimization	May 11, 2020	DenoisingGPU	—Unverified	0
Text Synopsis Generation for Egocentric Videos	May 8, 2020	Multi-Task LearningVideo Summarization	—Unverified	0
Query-controllable Video Summarization	Apr 7, 2020	Video Summarization	CodeCode Available	1
Group Activity Recognition by Using Effective Multiple Modality Relation Representation With Temporal-Spatial Attention	Mar 10, 2020	Activity RecognitionAutonomous Vehicles	—Unverified	0
Convolutional Hierarchical Attention Network for Query-Focused Video Summarization	Jan 31, 2020	Query focused video summarizationVideo Summarization	CodeCode Available	1
Weakly Supervised Video Summarization by Hierarchical Reinforcement Learning	Jan 12, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Unsupervised Video Summarization via Attention-Driven Adversarial Learning	Dec 24, 2019	Unsupervised Video SummarizationVideo Summarization	CodeCode Available	0
ILS-SUMM: Iterated Local Search for Unsupervised Video Summarization	Dec 8, 2019	Metaheuristic OptimizationUnsupervised Video Summarization	CodeCode Available	0
An Attention-Based Speaker Naming Method for Online Adaptation in Non-Fixed Scenarios	Dec 2, 2019	Video Summarization	—Unverified	0
A Graph-based Ranking Approach to Extract Key-frames for Static Video Summarization	Nov 29, 2019	Video Summarization	—Unverified	0
Visual Summarization of Scholarly Videos using Word Embeddings and Keyphrase Extraction	Nov 25, 2019	Keyphrase ExtractionOptical Character Recognition	—Unverified	0
Non-Monotone Submodular Maximization with Multiple Knapsacks in Static and Dynamic Settings	Nov 15, 2019	Video Summarization	—Unverified	0
Comprehensive Video Understanding: Video summarization with content-based video recommender design	Oct 30, 2019	Action RecognitionData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 7 of 12Next →

All datasets SumMe TvSum Shot2Story20K Query-Focused Video Summarization Dataset Mr. HiSum VideoXum

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	F1-score (Canonical)	55.6	—	Unverified
2	RR-STG	F1-score (Canonical)	54.5	—	Unverified
3	DSNet	F1-score (Canonical)	53	—	Unverified
4	VASNet	F1-score (Canonical)	49.71	—	Unverified
5	M-AVS	F1-score (Canonical)	44.4	—	Unverified
6	CSTA	Kendall's Tau	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RR-STG	F1-score (Canonical)	63	—	Unverified
2	DSNet	F1-score (Canonical)	62.1	—	Unverified
3	VASNet	F1-score (Canonical)	61.42	—	Unverified
4	M-AVS	F1-score (Canonical)	61	—	Unverified
5	PGL-SUM	F1-score (Canonical)	61	—	Unverified
6	CSTA	Kendall's Tau	0.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Shotluck-Holmes (3.1B)	CIDEr	152.3	—	Unverified
2	Shotluck-Holmes (3.1B)	CIDEr	63.2	—	Unverified
3	SUM-shot	CIDEr	8.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EgoVLPv2	F1 (avg)	52.08	—	Unverified
2	EgoVLP	F1 (avg)	49.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PGL-SUM	MAP (50%)	61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTSUM-BLIP	1 shot Micro-F1	23.5	—	Unverified