Video Description

The goal of automatic Video Description is to tell a story about events happening in a video. While early Video Description methods produced captions for short clips that were manually segmented to contain a single event of interest, more recently dense video captioning has been proposed to both segment distinct events in time and describe them in a series of coherent sentences. This problem is a generalization of dense image region captioning and has many practical applications, such as generating textual summaries for the visually impaired, or detecting and describing important events in surveillance footage.

Source: Joint Event Detection and Description in Continuous Video Streams

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 104 papers

Title	Date	Tasks	Status
Efficient data-driven encoding of scene motion using Eccentricity	Mar 3, 2021	Activity RecognitionIntent Recognition	—Unverified
The Role of the Input in Natural Language Video Description	Feb 9, 2021	Data AugmentationVideo Description	—Unverified
Unbox the Blackbox: Predict and Interpret YouTube Viewership Using Deep Learning	Dec 21, 2020	MisinformationPrediction	—Unverified
MSVD-Turkish: A Comprehensive Multimodal Dataset for Integrated Vision and Language Research in Turkish	Dec 13, 2020	Machine TranslationMultimodal Machine Translation	—Unverified
A Comprehensive Review on Recent Methods and Challenges of Video Description	Nov 30, 2020	Machine TranslationSurvey	—Unverified
Describing Unseen Videos via Multi-Modal Cooperative Dialog Agents	Aug 18, 2020	Video Description	CodeCode Available
Active Learning for Video Description With Cluster-Regularized Ensemble Ranking	Jul 27, 2020	Active LearningVideo Captioning	—Unverified
Multi-Layer Content Interaction Through Quaternion Product For Visual Question Answering	Jan 3, 2020	Question AnsweringVideo Description	—Unverified
VizSeq: A Visual Analysis Toolkit for Text Generation Tasks	Sep 12, 2019	BenchmarkingImage Captioning	CodeCode Available
Prediction and Description of Near-Future Activities in Video	Aug 2, 2019	PredictionVideo Captioning	—Unverified
End-to-End Video Captioning	Apr 4, 2019	Action RecognitionCaption Generation	—Unverified
Adversarial Inference for Multi-Sentence Video Description	Dec 13, 2018	DiversityImage Captioning	CodeCode Available
A Dataset for Telling the Stories of Social Media Videos	Oct 1, 2018	SentenceVideo Captioning	—Unverified
Incorporating Background Knowledge into Video Description Generation	Oct 1, 2018	DecoderText Generation	—Unverified
Attentive Sequence to Sequence Translation for Localizing Clips of Interest by Natural Language Descriptions	Aug 27, 2018	TranslationVideo Description	—Unverified
Bridge Video and Text with Cascade Syntactic Structure	Aug 1, 2018	AttributeObject	—Unverified
Multimodal Neural Machine Translation for Low-resource Language Pairs using Synthetic Data	Jul 1, 2018	Image DescriptionMachine Translation	—Unverified
End-to-End Audio Visual Scene-Aware Dialog using Multimodal Attention-Based Video Features	Jun 21, 2018	Question AnsweringVideo Description	CodeCode Available
Interpretable Video Captioning via Trajectory Structured Localization	Jun 1, 2018	DecoderImage Captioning	—Unverified
Video Description: A Survey of Methods, Datasets and Evaluation Metrics	Jun 1, 2018	DiversityLanguage Modeling	—Unverified
Incorporating Semantic Attention in Video Description Generation	May 1, 2018	Image CaptioningImage Classification	—Unverified
Integrating both Visual and Audio Cues for Enhanced Video Caption	Nov 22, 2017	DescriptiveSentence	—Unverified
Attend and Interact: Higher-Order Object Interactions for Video Understanding	Nov 16, 2017	Action ClassificationAction Recognition	—Unverified
Predicting Visual Features from Text for Image and Video Caption Retrieval	Sep 5, 2017	RetrievalSentence	CodeCode Available
Incorporating Global Visual Features into Attention-based Neural Machine Translation.	Sep 1, 2017	DecoderMachine Translation	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

No leaderboard results yet.