SOTAVerified|Agents Browse Leaderboard About

Video Description

The goal of automatic Video Description is to tell a story about events happening in a video. While early Video Description methods produced captions for short clips that were manually segmented to contain a single event of interest, more recently dense video captioning has been proposed to both segment distinct events in time and describe them in a series of coherent sentences. This problem is a generalization of dense image region captioning and has many practical applications, such as generating textual summaries for the visually impaired, or detecting and describing important events in surveillance footage.

Source: Joint Event Detection and Description in Continuous Video Streams

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 81–90 of 104 papers

Title	Date	Tasks	Status
NarrationBot and InfoBot: A Hybrid System for Automated Video Description	Nov 7, 2021	Video Description	—Unverified
Natural Language Descriptions of Human Activities Scenes: Corpus Generation and Analysis	Aug 1, 2016	Action ClassificationObject Recognition	—Unverified
Neural Headline Generation on Abstract Meaning Representation	Nov 1, 2016	Abstract Meaning RepresentationDependency Parsing	—Unverified
Noisy Parallel Approximate Decoding for Conditional Recurrent Language Model	May 12, 2016	Language ModelingLanguage Modelling	—Unverified
Probabilistic Soft Logic for Semantic Textual Similarity	Jun 1, 2014	Semantic Textual SimilarityVideo Description	—Unverified
PV-VTT: A Privacy-Centric Dataset for Mission-Specific Anomaly Detection and Natural Language Interpretation	Oct 30, 2024	Anomaly DetectionDescriptive	—Unverified
JMI at SemEval 2024 Task 3: Two-step approach for multimodal ECAC using in-context learning with GPT and instruction-tuned Llama models	Mar 5, 2024	In-Context LearningVideo Description	CodeCode Available
Predicting Visual Features from Text for Image and Video Caption Retrieval	Sep 5, 2017	RetrievalSentence	CodeCode Available
Describing Videos by Exploiting Temporal Structure	Feb 27, 2015	Action RecognitionImage Description	CodeCode Available
Learn to Understand Negation in Video Retrieval	Apr 30, 2022	Natural Language QueriesNegation	CodeCode Available

Show:10 25 50

← PrevPage 9 of 11Next →

No leaderboard results yet.