3D Object Detection

3D Object Detection is a task in computer vision where the goal is to identify and locate objects in a 3D environment based on their shape, location, and orientation. It involves detecting the presence of objects and determining their location in the 3D space in real-time. This task is crucial for applications such as autonomous vehicles, robotics, and augmented reality.

( Image credit: AVOD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1576 papers

Title	Date	Tasks	Status	Hype
BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers	Mar 31, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	4
TUMTraf V2X Cooperative Perception Dataset	Mar 2, 2024	3D Object DetectionAutonomous Vehicles	CodeCode Available	4
UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height	Sep 17, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	4
BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective Supervision	Nov 18, 2022	3D Object Detection	CodeCode Available	4
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects	Dec 13, 2023	3D Object Detection3D Object Tracking	CodeCode Available	4
ActiveAnno3D -- An Active Learning Framework for Multi-Modal 3D Object Detection	Feb 5, 2024	3D Object DetectionActive Learning	CodeCode Available	4
BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation	May 26, 2022	3D Multi-Object Tracking3D Object Detection	CodeCode Available	4
BEVDet4D: Exploit Temporal Cues in Multi-camera 3D Object Detection	Mar 31, 2022	3D Object Detectionobject-detection	CodeCode Available	3
IS-Fusion: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection	Mar 22, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	3
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation	Mar 24, 2022	3D Object Detection6D Pose Estimation using RGB	CodeCode Available	3
PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images	Jun 2, 2022	3D Lane Detection3D Object Detection	CodeCode Available	3
LION: Linear Group RNN for 3D Object Detection in Point Clouds	Jul 25, 2024	3D Object DetectionLong-range modeling	CodeCode Available	3
Cross Modal Transformer: Towards Fast and Robust 3D Object Detection	Jan 3, 2023	3D Object Detectionobject-detection	CodeCode Available	3
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation	Mar 22, 2023	3D Object Detection6D Pose Estimation using RGB	CodeCode Available	3
RCBEVDet: Radar-camera Fusion in Bird's Eye View for 3D Object Detection	Mar 25, 2024	3D Object Detection3D Object Detection (RoI)	CodeCode Available	3
Detecting As Labeling: Rethinking LiDAR-camera Fusion in 3D Object Detection	Nov 13, 2023	3D Object Detectionobject-detection	CodeCode Available	3
MagicDrive: Street View Generation with Diverse 3D Geometry Control	Oct 4, 2023	3D geometry3D Object Detection	CodeCode Available	3
Leveraging Vision-Centric Multi-Modal Expertise for 3D Object Detection	Oct 24, 2023	3D Object Detectionobject-detection	CodeCode Available	3
Collaborative Novel Object Discovery and Box-Guided Cross-Modal Alignment for Open-Vocabulary 3D Object Detection	Jun 2, 2024	3D Object Detectioncross-modal alignment	CodeCode Available	3
SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving	Mar 16, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	3
Detect Anything 3D in the Wild	Apr 10, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	3
Cubify Anything: Scaling Indoor 3D Object Detection	Dec 5, 2024	3D Object DetectionObject	CodeCode Available	3
Text-guided Sparse Voxel Pruning for Efficient 3D Visual Grounding	Feb 14, 2025	3D Object Detection3D visual grounding	CodeCode Available	3
Panacea+: Panoramic and Controllable Video Generation for Autonomous Driving	Aug 14, 2024	3D Object Detection3D Object Tracking	CodeCode Available	3
DeepInteraction++: Multi-Modality Interaction for Autonomous Driving	Aug 9, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	3
BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects	Mar 24, 2023	3D Object Detection3D Object Tracking	CodeCode Available	3
Geometric-aware Pretraining for Vision-centric 3D Object Detection	Apr 6, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	3
PETR: Position Embedding Transformation for Multi-View 3D Object Detection	Mar 10, 2022	3D Object DetectionObject	CodeCode Available	3
Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models	Jun 10, 2025	3D Lane Detection3D Object Detection	CodeCode Available	3
EMIFF: Enhanced Multi-scale Image Feature Fusion for Vehicle-Infrastructure Cooperative 3D Object Detection	Feb 23, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
EFFOcc: A Minimal Baseline for EFficient Fusion-based 3D Occupancy Network	Jun 11, 2024	3D Object DetectionActive Learning	CodeCode Available	2
A Simple Framework for 3D Occupancy Estimation in Autonomous Driving	Mar 17, 2023	3D Object Detection3D Reconstruction	CodeCode Available	2
EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models	Jun 14, 2024	3D Object Detection3D Reconstruction	CodeCode Available	2
Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D Object Detection	Mar 21, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
Drones Help Drones: A Collaborative Framework for Multi-Drone Object Trajectory Prediction and Beyond	May 23, 2024	3D Object Detectionobject-detection	CodeCode Available	2
DiffBEV: Conditional Diffusion Model for Bird's Eye View Perception	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets	Jan 15, 2023	3D Object Detectionobject-detection	CodeCode Available	2
DetZero: Rethinking Offboard 3D Object Detection with Long-term Sequential Point Clouds	Jun 9, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
Aria Digital Twin: A New Benchmark Dataset for Egocentric 3D Machine Perception	Jun 10, 2023	3D Object DetectionBenchmarking	CodeCode Available	2
DEVIANT: Depth EquiVarIAnt NeTwork for Monocular 3D Object Detection	Jul 21, 2022	3D Object Detection3D Object Detection From Monocular Images	CodeCode Available	2
EA-LSS: Edge-aware Lift-splat-shot Framework for 3D BEV Object Detection	Mar 31, 2023	3D Object DetectionDepth Estimation	CodeCode Available	2
FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin	Nov 18, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
DAIR-V2X: A Large-Scale Dataset for Vehicle-Infrastructure Cooperative 3D Object Detection	Apr 12, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
Complex-YOLO: Real-time 3D Object Detection on Point Clouds	Mar 16, 2018	3D Object DetectionAutonomous Driving	CodeCode Available	2
Commonsense Prototype for Outdoor Unsupervised 3D Object Detection	Apr 25, 2024	3D Object DetectionObject	CodeCode Available	2
DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction	Sep 30, 2024	3D Object Detection3D Semantic Occupancy Prediction	CodeCode Available	2
CoBEVT: Cooperative Bird's Eye View Semantic Segmentation with Sparse Transformers	Jul 5, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
Argoverse 2: Next Generation Datasets for Self-Driving Perception and Forecasting	Jan 2, 2023	3D Object DetectionMotion Forecasting	CodeCode Available	2
CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers	Mar 9, 2022	3D Object DetectionAutonomous Vehicles	CodeCode Available	2
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection	Oct 4, 2023	3D Object Detectioncross-modal alignment	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 32Next →

All datasets nuScenes ScanNetV2 SUN-RGBD val KITTI Cars Easy KITTI Cars Hard nuScenes Camera Only KITTI Cars Easy val KITTI Cars Moderate val nuscenes Camera-Radar View-of-Delft (val)KITTI Cars Hard val DAIR-V2X-I

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EA-LSS	NDS	0.78	—	Unverified
2	MegFusion	NDS	0.77	—	Unverified
3	MMFusion-e	NDS	0.77	—	Unverified
4	DeepInteraction-large	NDS	0.76	—	Unverified
5	DeepInteraction-e	NDS	0.76	—	Unverified
6	BEVFusion-e	NDS	0.76	—	Unverified
7	RacoonPower	NDS	0.76	—	Unverified
8	ADS-TEAM	NDS	0.75	—	Unverified
9	CenterPoint-Fusion	NDS	0.75	—	Unverified
10	UniTR	NDS	0.75	—	Unverified