3D Object Detection

3D Object Detection is a task in computer vision where the goal is to identify and locate objects in a 3D environment based on their shape, location, and orientation. It involves detecting the presence of objects and determining their location in the 3D space in real-time. This task is crucial for applications such as autonomous vehicles, robotics, and augmented reality.

( Image credit: AVOD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1576 papers

Title	Date	Tasks	Status	Hype
UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height	Sep 17, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	4
TUMTraf V2X Cooperative Perception Dataset	Mar 2, 2024	3D Object DetectionAutonomous Vehicles	CodeCode Available	4
ActiveAnno3D -- An Active Learning Framework for Multi-Modal 3D Object Detection	Feb 5, 2024	3D Object DetectionActive Learning	CodeCode Available	4
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects	Dec 13, 2023	3D Object Detection3D Object Tracking	CodeCode Available	4
BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective Supervision	Nov 18, 2022	3D Object Detection	CodeCode Available	4
BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation	May 26, 2022	3D Multi-Object Tracking3D Object Detection	CodeCode Available	4
BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers	Mar 31, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	4
Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models	Jun 10, 2025	3D Lane Detection3D Object Detection	CodeCode Available	3
Detect Anything 3D in the Wild	Apr 10, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	3
Text-guided Sparse Voxel Pruning for Efficient 3D Visual Grounding	Feb 14, 2025	3D Object Detection3D visual grounding	CodeCode Available	3
Cubify Anything: Scaling Indoor 3D Object Detection	Dec 5, 2024	3D Object DetectionObject	CodeCode Available	3
Panacea+: Panoramic and Controllable Video Generation for Autonomous Driving	Aug 14, 2024	3D Object Detection3D Object Tracking	CodeCode Available	3
DeepInteraction++: Multi-Modality Interaction for Autonomous Driving	Aug 9, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	3
LION: Linear Group RNN for 3D Object Detection in Point Clouds	Jul 25, 2024	3D Object DetectionLong-range modeling	CodeCode Available	3
Collaborative Novel Object Discovery and Box-Guided Cross-Modal Alignment for Open-Vocabulary 3D Object Detection	Jun 2, 2024	3D Object Detectioncross-modal alignment	CodeCode Available	3
RCBEVDet: Radar-camera Fusion in Bird's Eye View for 3D Object Detection	Mar 25, 2024	3D Object Detection3D Object Detection (RoI)	CodeCode Available	3
IS-Fusion: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection	Mar 22, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	3
Detecting As Labeling: Rethinking LiDAR-camera Fusion in 3D Object Detection	Nov 13, 2023	3D Object Detectionobject-detection	CodeCode Available	3
Leveraging Vision-Centric Multi-Modal Expertise for 3D Object Detection	Oct 24, 2023	3D Object Detectionobject-detection	CodeCode Available	3
MagicDrive: Street View Generation with Diverse 3D Geometry Control	Oct 4, 2023	3D geometry3D Object Detection	CodeCode Available	3
Geometric-aware Pretraining for Vision-centric 3D Object Detection	Apr 6, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	3
BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects	Mar 24, 2023	3D Object Detection3D Object Tracking	CodeCode Available	3
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation	Mar 22, 2023	3D Object Detection6D Pose Estimation using RGB	CodeCode Available	3
SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving	Mar 16, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	3
Cross Modal Transformer: Towards Fast and Robust 3D Object Detection	Jan 3, 2023	3D Object Detectionobject-detection	CodeCode Available	3
PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images	Jun 2, 2022	3D Lane Detection3D Object Detection	CodeCode Available	3
BEVDet4D: Exploit Temporal Cues in Multi-camera 3D Object Detection	Mar 31, 2022	3D Object Detectionobject-detection	CodeCode Available	3
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation	Mar 24, 2022	3D Object Detection6D Pose Estimation using RGB	CodeCode Available	3
PETR: Position Embedding Transformation for Multi-View 3D Object Detection	Mar 10, 2022	3D Object DetectionObject	CodeCode Available	3
MambaFusion: Height-Fidelity Dense Global Fusion for Multi-modal 3D Object Detection	Jul 6, 2025	3D Object DetectionAttribute	CodeCode Available	2
Simulate Any Radar: Attribute-Controllable Radar Simulation via Waveform Parameter Embedding	Jun 3, 2025	3D Object DetectionAttribute	CodeCode Available	2
HGSFusion: Radar-Camera Fusion with Hybrid Generation and Synchronization for 3D Object Detection	Dec 16, 2024	3D Object Detection3D Object Detection on View-of-Delft (val)	CodeCode Available	2
OpenAD: Open-World Autonomous Driving Benchmark for 3D Object Detection	Nov 26, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
Open Vocabulary Monocular 3D Object Detection	Nov 25, 2024	3D Object DetectionMonocular 3D Object Detection	CodeCode Available	2
GaussianPretrain: A Simple Unified 3D Gaussian Representation for Visual Pre-training in Autonomous Driving	Nov 19, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
V2X-R: Cooperative LiDAR-4D Radar Fusion for 3D Object Detection with Denoising Diffusion	Nov 13, 2024	3D Object DetectionDenoising	CodeCode Available	2
ImOV3D: Learning Open-Vocabulary Point Clouds 3D Object Detection from Only 2D Images	Oct 31, 2024	3D Object DetectionDepth Estimation	CodeCode Available	2
MonoDGP: Monocular 3D Object Detection with Decoupled-Query and Geometry-Error Priors	Oct 25, 2024	3D Object DetectionDepth Estimation	CodeCode Available	2
3DGS-DET: Empower 3D Gaussian Splatting with Boundary Guidance and Box-Focused Sampling for 3D Object Detection	Oct 2, 2024	3DGS3D Object Detection	CodeCode Available	2
DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction	Sep 30, 2024	3D Object Detection3D Semantic Occupancy Prediction	CodeCode Available	2
RockTrack: A 3D Robust Multi-Camera-Ken Multi-Object Tracking Framework	Sep 18, 2024	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
UniDet3D: Multi-dataset Indoor 3D Object Detection	Sep 6, 2024	3D Object DetectionObject	CodeCode Available	2
L4DR: LiDAR-4DRadar Fusion for Weather-Robust 3D Object Detection	Aug 7, 2024	3D Object DetectionAutonomous Navigation	CodeCode Available	2
MonoWAD: Weather-Adaptive Diffusion Model for Robust Monocular 3D Object Detection	Jul 23, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
OPEN: Object-wise Position Embedding for Multi-view 3D Object Detection	Jul 15, 2024	3D Object DetectionDepth Estimation	CodeCode Available	2
When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset	Jul 14, 2024	3D Object DetectionMultispectral Object Detection	CodeCode Available	2
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection	Jun 15, 2024	3D Object DetectionComputational Efficiency	CodeCode Available	2
EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models	Jun 14, 2024	3D Object Detection3D Reconstruction	CodeCode Available	2
BEVSpread: Spread Voxel Pooling for Bird's-Eye-View Representation in Vision-based Roadside 3D Object Detection	Jun 13, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
EFFOcc: A Minimal Baseline for EFficient Fusion-based 3D Occupancy Network	Jun 11, 2024	3D Object DetectionActive Learning	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 32Next →

All datasets nuScenes ScanNetV2 SUN-RGBD val KITTI Cars Easy KITTI Cars Hard nuScenes Camera Only KITTI Cars Easy val KITTI Cars Moderate val nuscenes Camera-Radar View-of-Delft (val)KITTI Cars Hard val DAIR-V2X-I

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EA-LSS	NDS	0.78	—	Unverified
2	MegFusion	NDS	0.77	—	Unverified
3	MMFusion-e	NDS	0.77	—	Unverified
4	DeepInteraction-large	NDS	0.76	—	Unverified
5	DeepInteraction-e	NDS	0.76	—	Unverified
6	BEVFusion-e	NDS	0.76	—	Unverified
7	RacoonPower	NDS	0.76	—	Unverified
8	ADS-TEAM	NDS	0.75	—	Unverified
9	CenterPoint-Fusion	NDS	0.75	—	Unverified
10	UniTR	NDS	0.75	—	Unverified