3D Object Detection

3D Object Detection is a task in computer vision where the goal is to identify and locate objects in a 3D environment based on their shape, location, and orientation. It involves detecting the presence of objects and determining their location in the 3D space in real-time. This task is crucial for applications such as autonomous vehicles, robotics, and augmented reality.

( Image credit: AVOD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 1576 papers

Title	Date	Tasks	Status	Hype	Score
ActiveAnno3D -- An Active Learning Framework for Multi-Modal 3D Object Detection	Feb 5, 2024	3D Object DetectionActive Learning	CodeCode Available	4	5
BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers	Mar 31, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	4	5
BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective Supervision	Nov 18, 2022	3D Object Detection	CodeCode Available	4	5
BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation	May 26, 2022	3D Multi-Object Tracking3D Object Detection	CodeCode Available	4	5
TUMTraf V2X Cooperative Perception Dataset	Mar 2, 2024	3D Object DetectionAutonomous Vehicles	CodeCode Available	4	5
UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height	Sep 17, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	4	5
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects	Dec 13, 2023	3D Object Detection3D Object Tracking	CodeCode Available	4	5
PETR: Position Embedding Transformation for Multi-View 3D Object Detection	Mar 10, 2022	3D Object DetectionObject	CodeCode Available	3	5
LION: Linear Group RNN for 3D Object Detection in Point Clouds	Jul 25, 2024	3D Object DetectionLong-range modeling	CodeCode Available	3	5
PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images	Jun 2, 2022	3D Lane Detection3D Object Detection	CodeCode Available	3	5
Leveraging Vision-Centric Multi-Modal Expertise for 3D Object Detection	Oct 24, 2023	3D Object Detectionobject-detection	CodeCode Available	3	5
BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects	Mar 24, 2023	3D Object Detection3D Object Tracking	CodeCode Available	3	5
MagicDrive: Street View Generation with Diverse 3D Geometry Control	Oct 4, 2023	3D geometry3D Object Detection	CodeCode Available	3	5
Panacea+: Panoramic and Controllable Video Generation for Autonomous Driving	Aug 14, 2024	3D Object Detection3D Object Tracking	CodeCode Available	3	5
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation	Mar 24, 2022	3D Object Detection6D Pose Estimation using RGB	CodeCode Available	3	5
Detecting As Labeling: Rethinking LiDAR-camera Fusion in 3D Object Detection	Nov 13, 2023	3D Object Detectionobject-detection	CodeCode Available	3	5
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation	Mar 22, 2023	3D Object Detection6D Pose Estimation using RGB	CodeCode Available	3	5
Cross Modal Transformer: Towards Fast and Robust 3D Object Detection	Jan 3, 2023	3D Object Detectionobject-detection	CodeCode Available	3	5
Detect Anything 3D in the Wild	Apr 10, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	3	5
BEVDet4D: Exploit Temporal Cues in Multi-camera 3D Object Detection	Mar 31, 2022	3D Object Detectionobject-detection	CodeCode Available	3	5
Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models	Jun 10, 2025	3D Lane Detection3D Object Detection	CodeCode Available	3	5
Cubify Anything: Scaling Indoor 3D Object Detection	Dec 5, 2024	3D Object DetectionObject	CodeCode Available	3	5
Geometric-aware Pretraining for Vision-centric 3D Object Detection	Apr 6, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	3	5
IS-Fusion: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection	Mar 22, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	3	5
Collaborative Novel Object Discovery and Box-Guided Cross-Modal Alignment for Open-Vocabulary 3D Object Detection	Jun 2, 2024	3D Object Detectioncross-modal alignment	CodeCode Available	3	5

Show:10 25 50

← PrevPage 1 of 64Next →

All datasets nuScenes ScanNetV2 SUN-RGBD val KITTI Cars Easy KITTI Cars Hard nuScenes Camera Only KITTI Cars Easy val KITTI Cars Moderate val nuscenes Camera-Radar View-of-Delft (val)KITTI Cars Hard val DAIR-V2X-I

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EA-LSS	NDS	0.78	—	Unverified
2	MegFusion	NDS	0.77	—	Unverified
3	MMFusion-e	NDS	0.77	—	Unverified
4	DeepInteraction-large	NDS	0.76	—	Unverified
5	DeepInteraction-e	NDS	0.76	—	Unverified
6	BEVFusion-e	NDS	0.76	—	Unverified
7	RacoonPower	NDS	0.76	—	Unverified
8	ADS-TEAM	NDS	0.75	—	Unverified
9	CenterPoint-Fusion	NDS	0.75	—	Unverified
10	UniTR	NDS	0.75	—	Unverified