SOTAVerified|Agents Browse Leaderboard About

3D dense captioning

Dense captioning in 3D point clouds is an emerging vision-and-language task involving object-level 3D scene understanding. Apart from coarse semantic class prediction and bounding box regression as in traditional 3D object detection, 3D dense captioning aims at producing a further and finer instance-level label of natural language description on visual appearance and spatial relations for each scene object of interest.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–26 of 26 papers

Title	Date	Tasks	Status	Hype
Spatiality-guided Transformer for 3D Dense Captioning on Point Clouds	Apr 22, 2022	3D dense captioning3D Object Detection	CodeCode Available	1
MORE: Multi-Order RElation Mining for Dense Captioning in 3D Scenes	Mar 10, 2022	3D dense captioningDense Captioning	CodeCode Available	1
X-Trans2Cap: Cross-Modal Knowledge Transfer using Transformer for 3D Dense Captioning	Mar 2, 2022	3D dense captioningDense Captioning	CodeCode Available	1
3DJCG: A Unified Framework for Joint Dense Captioning and Visual Grounding on 3D Point Clouds	Jan 1, 2022	3D dense captioningAttribute	—Unverified	0
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding	Dec 2, 2021	3D dense captioning3D visual grounding	—Unverified	0
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans	Dec 3, 2020	3D dense captioning3D Object Detection	—Unverified	0

Show:10 25 50

← PrevPage 3 of 3Next →

No leaderboard results yet.