3D Object Detection

3D Object Detection is a task in computer vision where the goal is to identify and locate objects in a 3D environment based on their shape, location, and orientation. It involves detecting the presence of objects and determining their location in the 3D space in real-time. This task is crucial for applications such as autonomous vehicles, robotics, and augmented reality.

( Image credit: AVOD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1576 papers

Title	Date	Tasks	Status	Hype
Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud Pre-training	May 28, 2022	3D Object Detection3D Point Cloud Classification	CodeCode Available	2
PointPillars: Fast Encoders for Object Detection from Point Clouds	Dec 14, 2018	3D Object DetectionAutonomous Driving	CodeCode Available	2
RCooper: A Real-world Large-scale Dataset for Roadside Cooperative Perception	Mar 15, 2024	3D Object Detection3D Object Tracking	CodeCode Available	2
RoboFusion: Towards Robust Multi-Modal 3D Object Detection via SAM	Jan 8, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
Ray Denoising: Depth-aware Hard Negative Sampling for Multi-view 3D Object Detection	Feb 6, 2024	3D Object DetectionDenoising	CodeCode Available	2
SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection	Mar 9, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
GaussianPretrain: A Simple Unified 3D Gaussian Representation for Visual Pre-training in Autonomous Driving	Nov 19, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras	Apr 3, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
SeaBird: Segmentation in Bird's View with Dice Loss Improves Monocular 3D Detection of Large Objects	Mar 29, 2024	3D Object Detection3D Object Detection From Monocular Images	CodeCode Available	2
Searching Efficient 3D Architectures with Sparse Point-Voxel Convolution	Jul 31, 2020	3D Object Detection3D Semantic Segmentation	CodeCode Available	2
Joint 2D-3D Multi-Task Learning on Cityscapes-3D: 3D Detection, Segmentation, and Depth Estimation	Apr 3, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
SparseBEV: High-Performance Sparse 3D Object Detection from Multi-Camera Videos	Aug 18, 2023	3D Object DetectionObject	CodeCode Available	2
DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction	Sep 30, 2024	3D Object Detection3D Semantic Occupancy Prediction	CodeCode Available	2
SparseFusion: Fusing Multi-Modal Sparse Representations for Multi-Sensor 3D Object Detection	Apr 27, 2023	3D Object Detectionobject-detection	CodeCode Available	2
FocalFormer3D: Focusing on Hard Instance for 3D Object Detection	Jan 1, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D Object Detection	Mar 21, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
Focal Sparse Convolutional Networks for 3D Object Detection	Apr 26, 2022	3D Object DetectionObject	CodeCode Available	2
DeepInteraction: 3D Object Detection via Modality Interaction	Aug 23, 2022	3D Object DetectionDecoder	CodeCode Available	2
EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models	Jun 14, 2024	3D Object Detection3D Reconstruction	CodeCode Available	2
TJ4DRadSet: A 4D Radar Dataset for Autonomous Driving	Apr 28, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
BEVHeight: A Robust Framework for Vision-based Roadside 3D Object Detection	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
EFFOcc: A Minimal Baseline for EFficient Fusion-based 3D Occupancy Network	Jun 11, 2024	3D Object DetectionActive Learning	CodeCode Available	2
Argoverse 2: Next Generation Datasets for Self-Driving Perception and Forecasting	Jan 2, 2023	3D Object DetectionMotion Forecasting	CodeCode Available	2
Aria Digital Twin: A New Benchmark Dataset for Egocentric 3D Machine Perception	Jun 10, 2023	3D Object DetectionBenchmarking	CodeCode Available	2
UniTR: A Unified and Efficient Multi-Modal Transformer for Bird's-Eye-View Representation	Aug 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
V2V4Real: A Real-world Large-scale Dataset for Vehicle-to-Vehicle Cooperative Perception	Mar 14, 2023	3D Object Detection3D Object Tracking	CodeCode Available	2
Drones Help Drones: A Collaborative Framework for Multi-Drone Object Trajectory Prediction and Beyond	May 23, 2024	3D Object Detectionobject-detection	CodeCode Available	2
BEVDet: High-performance Multi-camera 3D Object Detection in Bird-Eye-View	Dec 22, 2021	3D Object DetectionAutonomous Driving	CodeCode Available	2
DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets	Jan 15, 2023	3D Object Detectionobject-detection	CodeCode Available	2
DetZero: Rethinking Offboard 3D Object Detection with Long-term Sequential Point Clouds	Jun 9, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
A Simple Framework for 3D Occupancy Estimation in Autonomous Driving	Mar 17, 2023	3D Object Detection3D Reconstruction	CodeCode Available	2
DEVIANT: Depth EquiVarIAnt NeTwork for Monocular 3D Object Detection	Jul 21, 2022	3D Object Detection3D Object Detection From Monocular Images	CodeCode Available	2
BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework	May 27, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
BEVerse: Unified Perception and Prediction in Birds-Eye-View for Vision-Centric Autonomous Driving	May 19, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection	Jun 21, 2022	3D Object DetectionDepth Estimation	CodeCode Available	2
CenterFormer: Center-based Transformer for 3D Object Detection	Sep 12, 2022	3D Object DetectionObject	CodeCode Available	2
DiffBEV: Conditional Diffusion Model for Bird's Eye View Perception	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
EMIFF: Enhanced Multi-scale Image Feature Fusion for Vehicle-Infrastructure Cooperative 3D Object Detection	Feb 23, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
BEVSpread: Spread Voxel Pooling for Bird's-Eye-View Representation in Vision-based Roadside 3D Object Detection	Jun 13, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo	Sep 21, 2022	3D Object DetectionDepth Estimation	CodeCode Available	2
FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin	Nov 18, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
FocalFormer3D : Focusing on Hard Instance for 3D Object Detection	Aug 8, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
EA-LSS: Edge-aware Lift-splat-shot Framework for 3D BEV Object Detection	Mar 31, 2023	3D Object DetectionDepth Estimation	CodeCode Available	2
Fully Test-Time Adaptation for Monocular 3D Object Detection	May 30, 2024	3D Object DetectionMonocular 3D Object Detection	CodeCode Available	2
Fully Sparse 3D Object Detection	Jul 20, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
Generative Sparse Detection Networks for 3D Single-shot Object Detection	Jun 22, 2020	3D Object DetectionDecoder	CodeCode Available	2
LISO: Lidar-only Self-Supervised 3D Object Detection	Mar 11, 2024	3D Object DetectionObject	CodeCode Available	2
Is Your LiDAR Placement Optimized for 3D Scene Understanding?	Mar 25, 2024	3D Object DetectionLIDAR Semantic Segmentation	CodeCode Available	2
Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data	Mar 30, 2022	3D Object Detection3D Semantic Segmentation	CodeCode Available	2
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection	Jun 15, 2024	3D Object DetectionComputational Efficiency	CodeCode Available	2

Show:10 25 50

← PrevPage 3 of 32Next →

All datasets nuScenes ScanNetV2 SUN-RGBD val KITTI Cars Easy KITTI Cars Hard nuScenes Camera Only KITTI Cars Easy val KITTI Cars Moderate val nuscenes Camera-Radar View-of-Delft (val)KITTI Cars Hard val DAIR-V2X-I

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EA-LSS	NDS	0.78	—	Unverified
2	MegFusion	NDS	0.77	—	Unverified
3	MMFusion-e	NDS	0.77	—	Unverified
4	DeepInteraction-large	NDS	0.76	—	Unverified
5	DeepInteraction-e	NDS	0.76	—	Unverified
6	BEVFusion-e	NDS	0.76	—	Unverified
7	RacoonPower	NDS	0.76	—	Unverified
8	ADS-TEAM	NDS	0.75	—	Unverified
9	CenterPoint-Fusion	NDS	0.75	—	Unverified
10	UniTR	NDS	0.75	—	Unverified