SOTAVerified|Agents Browse Leaderboard About Blog

Dense Captioning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–69 of 69 papers

Title	Date	Tasks	Status	Hype
Semantic-Aware Pretraining for Dense Video Captioning	Apr 13, 2022	Dense CaptioningDense Video Captioning	—Unverified	0
Team RUC_AIM3 Technical Report at Activitynet 2020 Task 2: Exploring Sequential Events Detection for Dense Video Captioning	Jun 14, 2020	Dense CaptioningDense Video Captioning	—Unverified	0
Trimmed Action Recognition, Dense-Captioning Events in Videos, and Spatio-temporal Action Localization with Focus on ActivityNet Challenge 2019	Jun 14, 2019	Action LocalizationAction Recognition	—Unverified	0
UniT3D: A Unified Transformer for 3D Dense Captioning and Visual Grounding	Dec 1, 2022	3D dense captioning3D visual grounding	—Unverified	0
Visually Grounded Word Embeddings and Richer Visual Features for Improving Multimodal Neural Machine Translation	Jul 4, 2017	Dense CaptioningMachine Translation	—Unverified	0
xGen-VideoSyn-1: High-fidelity Text-to-Video Synthesis with Compressed Representations	Aug 22, 2024	Dense CaptioningMotion Estimation	—Unverified	0
YH Technologies at ActivityNet Challenge 2018	Jun 29, 2018	Action LocalizationAction Recognition	—Unverified	0
RUC+CMU: System Report for Dense Captioning Events in Videos	Jun 22, 2018	Caption GenerationDense Captioning	—Unverified	0
SAVCHOI: Detecting Suspicious Activities using Dense Video Captioning with Human Object Interactions	Jul 24, 2022	Dense CaptioningDense Video Captioning	—Unverified	0
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans	Dec 3, 2020	3D dense captioning3D Object Detection	—Unverified	0
Scene-LLM: Extending Language Model for 3D Visual Understanding and Reasoning	Mar 18, 2024	3D Question Answering (3D-QA)Dense Captioning	—Unverified	0
Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization	Apr 17, 2024	3D dense captioning3D visual grounding	CodeCode Available	0
Joint Event Detection and Description in Continuous Video Streams	Feb 28, 2018	Dense CaptioningDense Video Captioning	CodeCode Available	0
DenseCap: Fully Convolutional Localization Networks for Dense Captioning	Nov 24, 2015	Dense CaptioningImage Captioning	CodeCode Available	0
IIITD-20K: Dense captioning for Text-Image ReID	May 8, 2023	Dense Captioning	CodeCode Available	0
Details Make a Difference: Object State-Sensitive Neurorobotic Task Planning	Jun 14, 2024	Dense CaptioningObject	CodeCode Available	0
Dense Captioning with Joint Inference and Visual Context	Nov 21, 2016	Dense CaptioningDescriptive	CodeCode Available	0
A Hierarchical Approach for Generating Descriptive Image Paragraphs	Nov 20, 2016	Dense CaptioningDescriptive	CodeCode Available	0
PaveCap: The First Multimodal Framework for Comprehensive Pavement Condition Assessment with Dense Captioning and PCI Estimation	Aug 7, 2024	DecoderDense Captioning	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 3Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ControlCap	mAP	18.2	—	Unverified
2	GRiT (ViT-B)	mAP	15.5	—	Unverified
3	CAG-Net	mAP	10.5	—	Unverified
4	FCLN	mAP	5.4	—	Unverified