Supervised Video Summarization

Supervised video summarization rely on datasets with human-labeled ground-truth annotations (either in the form of video summaries, as in the case of the SumMe dataset, or in the form of frame-level importance scores, as in the case of the TVSum dataset), based on which they try to discover the underlying criterion for video frame/fragment selection and video summarization.

Source: Video Summarization Using Deep Neural Networks: A Survey

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 28 papers

Title	Date	Tasks	Status	Hype
Align and Attend: Multimodal Summarization with Dual Contrastive Losses	Mar 13, 2023	Extractive Text SummarizationSupervised Video Summarization	CodeCode Available	1
Progressive Video Summarization via Multimodal Self-supervised Learning	Jan 7, 2022	Self-Supervised LearningSupervised Video Summarization	CodeCode Available	1
Video Joint Modelling Based on Hierarchical Transformer for Co-summarization	Dec 27, 2021	RetrievalSupervised Video Summarization	CodeCode Available	1
Combining Global and Local Attention with Positional Encoding for Video Summarization	Dec 1, 2021	Supervised Video SummarizationVideo Summarization	CodeCode Available	1
Self-Attention Recurrent Summarization Network with Reinforcement Learning for Video Summarization Task	Jun 9, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Supervised Video Summarization via Multiple Feature Sets with Parallel Attention	Apr 23, 2021	Automated Feature Engineeringimage-classification	CodeCode Available	1
DSNet: A Flexible Detect-to-Summarize Network for Video Summarization	Dec 1, 2020	regressionSupervised Video Summarization	CodeCode Available	1
TRIM: A Self-Supervised Video Summarization Framework Maximizing Temporal Relative Information and Representativeness	Jun 25, 2025	Self-Supervised LearningSupervised Video Summarization	—Unverified	0
FullTransNet: Full Transformer with Local-Global Attention for Video Summarization	Jan 1, 2025	DecoderSupervised Video Summarization	—Unverified	0
CSTA: CNN-based Spatiotemporal Attention for Video Summarization	May 20, 2024	Supervised Video SummarizationVideo Summarization	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

No leaderboard results yet.