3D dense captioning

Dense captioning in 3D point clouds is an emerging vision-and-language task involving object-level 3D scene understanding. Apart from coarse semantic class prediction and bounding box regression as in traditional 3D object detection, 3D dense captioning aims at producing a further and finer instance-level label of natural language description on visual appearance and spatial relations for each scene object of interest.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 26 papers

Title	Date	Tasks	Status	Hype	Score
LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding Reasoning and Planning	Jan 1, 2024	3D dense captioningDense Captioning	CodeCode Available	3	5
LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding, Reasoning, and Planning	Nov 30, 2023	3D dense captioningDense Captioning	CodeCode Available	2	5
An Embodied Generalist Agent in 3D World	Nov 18, 2023	3D dense captioning3D Question Answering (3D-QA)	CodeCode Available	2	5
TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes	Mar 28, 2024	3D dense captioningDense Captioning	CodeCode Available	2	5
Context-Aware Alignment and Mutual Masking for 3D-Language Pre-Training	Jan 1, 2023	3D dense captioning3D visual grounding	CodeCode Available	1	5
MORE: Multi-Order RElation Mining for Dense Captioning in 3D Scenes	Mar 10, 2022	3D dense captioningDense Captioning	CodeCode Available	1	5
End-to-End 3D Dense Captioning with Vote2Cap-DETR	Jan 6, 2023	3D dense captioningDecoder	CodeCode Available	1	5
Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense Captioning	Sep 6, 2023	3D dense captioningCaption Generation	CodeCode Available	1	5
X-Trans2Cap: Cross-Modal Knowledge Transfer using Transformer for 3D Dense Captioning	Mar 2, 2022	3D dense captioningDense Captioning	CodeCode Available	1	5
Spatiality-guided Transformer for 3D Dense Captioning on Point Clouds	Apr 22, 2022	3D dense captioning3D Object Detection	CodeCode Available	1	5
3D CoCa: Contrastive Learners are 3D Captioners	Apr 13, 2025	3D dense captioningCaption Generation	CodeCode Available	0	5
Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization	Apr 17, 2024	3D dense captioning3D visual grounding	CodeCode Available	0	5
MARVEL-40M+: Multi-Level Visual Elaboration for High-Fidelity Text-to-3D Content Creation	Nov 26, 2024	3D dense captioning3D Object Captioning	CodeCode Available	0	5
Hint-AD: Holistically Aligned Interpretability in End-to-End Autonomous Driving	Sep 10, 2024	3D dense captioningAutonomous Driving	—Unverified	0	0
3DJCG: A Unified Framework for Joint Dense Captioning and Visual Grounding on 3D Point Clouds	Jan 1, 2022	3D dense captioningAttribute	—Unverified	0	0
3D Scene Graph Guided Vision-Language Pre-training	Nov 27, 2024	3D dense captioning3D visual grounding	—Unverified	0	0
3D Spatial Understanding in MLLMs: Disambiguation and Evaluation	Dec 9, 2024	3D dense captioning3D visual grounding	—Unverified	0	0
A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing Objects in 3D Scenes	Mar 12, 2024	3D dense captioningDense Captioning	—Unverified	0	0
Bi-directional Contextual Attention for 3D Dense Captioning	Aug 13, 2024	3D dense captioningAttribute	—Unverified	0	0
Complete 3d relationships extraction modality alignment network for 3d dense captioning	Aug 1, 2024	3D dense captioning3D Object Detection	—Unverified	0	0
Contextual Modeling for 3D Dense Captioning on Point Clouds	Oct 8, 2022	3D dense captioningDense Captioning	—Unverified	0	0
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding	Dec 2, 2021	3D dense captioning3D visual grounding	—Unverified	0	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0	0
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans	Dec 3, 2020	3D dense captioning3D Object Detection	—Unverified	0	0
See It All: Contextualized Late Aggregation for 3D Dense Captioning	Aug 14, 2024	3D dense captioningAll	—Unverified	0	0

Show:10 25 50

← PrevPage 1 of 2Next →

No leaderboard results yet.