Video Description

The goal of automatic Video Description is to tell a story about events happening in a video. While early Video Description methods produced captions for short clips that were manually segmented to contain a single event of interest, more recently dense video captioning has been proposed to both segment distinct events in time and describe them in a series of coherent sentences. This problem is a generalization of dense image region captioning and has many practical applications, such as generating textual summaries for the visually impaired, or detecting and describing important events in surveillance footage.

Source: Joint Event Detection and Description in Continuous Video Streams

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 104 papers

Title	Date	Tasks	Status	Hype
Multi-modal News Understanding with Professionally Labelled Videos (ReutersViLNews)	Jan 23, 2024	MiscellaneousVideo Description	—Unverified	0
ActionHub: A Large-scale Action Video Description Dataset for Zero-shot Action Recognition	Jan 22, 2024	Action RecognitionVideo Description	—Unverified	0
Attention Based Encoder Decoder Model for Video Captioning in Nepali (2023)	Dec 12, 2023	DecoderVideo Captioning	—Unverified	0
Multi Sentence Description of Complex Manipulation Action Videos	Nov 13, 2023	DecoderSentence	—Unverified	0
CLearViD: Curriculum Learning for Video Description	Nov 8, 2023	DiversityVideo Description	—Unverified	0
Analyzing Political Figures in Real-Time: Leveraging YouTube Metadata for Sentiment Analysis	Sep 28, 2023	Sentiment AnalysisVideo Description	—Unverified	0
FunQA: Towards Surprising Video Comprehension	Jun 26, 2023	Question AnsweringText Generation	CodeCode Available	1
MSVD-Indonesian: A Benchmark for Multimodal Video-Text Tasks in Indonesian	Jun 20, 2023	Cross-Lingual TransferRetrieval	CodeCode Available	0
Edit As You Wish: Video Caption Editing with Multi-grained User Control	May 15, 2023	AttributePosition	CodeCode Available	0
Fine-grained Audible Video Description	Mar 27, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Thinking Hallucination for Video Captioning	Sep 28, 2022	HallucinationVideo Captioning	CodeCode Available	1
What's in a Caption? Dataset-Specific Linguistic Diversity and Its Effect on Visual Description Models and Metrics	May 12, 2022	DiversityVideo Description	CodeCode Available	1
Learn to Understand Negation in Video Retrieval	Apr 30, 2022	Natural Language QueriesNegation	CodeCode Available	0
Synchronized Audio-Visual Frames with Fractional Positional Encoding for Transformers in Video-to-Text Translation	Dec 28, 2021	Image CaptioningMachine Translation	—Unverified	0
Relational Graph Learning for Grounded Video Description Generation	Dec 2, 2021	Graph LearningHallucination	—Unverified	0
An Efficient Keyframes Selection Based Framework for Video Captioning	Dec 1, 2021	Text GenerationVideo Captioning	—Unverified	0
NarrationBot and InfoBot: A Hybrid System for Automated Video Description	Nov 7, 2021	Video Description	—Unverified	0
Visual-aware Attention Dual-stream Decoder for Video Captioning	Oct 16, 2021	DecoderVideo Captioning	—Unverified	0
Boosting Video Captioning with Dynamic Loss Network	Jul 25, 2021	image-classificationImage Classification	—Unverified	0
Efficient data-driven encoding of scene motion using Eccentricity	Mar 3, 2021	Activity RecognitionIntent Recognition	—Unverified	0
The Role of the Input in Natural Language Video Description	Feb 9, 2021	Data AugmentationVideo Description	—Unverified	0
Unbox the Blackbox: Predict and Interpret YouTube Viewership Using Deep Learning	Dec 21, 2020	MisinformationPrediction	—Unverified	0
MSVD-Turkish: A Comprehensive Multimodal Dataset for Integrated Vision and Language Research in Turkish	Dec 13, 2020	Machine TranslationMultimodal Machine Translation	—Unverified	0
A Comprehensive Review on Recent Methods and Challenges of Video Description	Nov 30, 2020	Machine TranslationSurvey	—Unverified	0
Identity-Aware Multi-Sentence Video Description	Aug 22, 2020	Gender PredictionSentence	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 5Next →

No leaderboard results yet.