3D Object Detection

3D Object Detection is a task in computer vision where the goal is to identify and locate objects in a 3D environment based on their shape, location, and orientation. It involves detecting the presence of objects and determining their location in the 3D space in real-time. This task is crucial for applications such as autonomous vehicles, robotics, and augmented reality.

( Image credit: AVOD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 1576 papers

Title	Date	Tasks	Status	Hype
GeminiFusion: Efficient Pixel-wise Multimodal Fusion for Vision Transformer	Jun 3, 2024	3D Object DetectionImage-to-Image Translation	CodeCode Available	2
Fully Test-Time Adaptation for Monocular 3D Object Detection	May 30, 2024	3D Object DetectionMonocular 3D Object Detection	CodeCode Available	2
Drones Help Drones: A Collaborative Framework for Multi-Drone Object Trajectory Prediction and Beyond	May 23, 2024	3D Object Detectionobject-detection	CodeCode Available	2
ViewFormer: Exploring Spatiotemporal Modeling for Multi-View 3D Occupancy Perception via View-Guided Transformers	May 7, 2024	3D Object Detectionobject-detection	CodeCode Available	2
Commonsense Prototype for Outdoor Unsupervised 3D Object Detection	Apr 25, 2024	3D Object DetectionObject	CodeCode Available	2
Scaling Multi-Camera 3D Object Detection through Weak-to-Strong Eliciting	Apr 10, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
MonoCD: Monocular 3D Object Detection with Complementary Depths	Apr 4, 2024	3D Object DetectionDepth Estimation	CodeCode Available	2
HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras	Apr 3, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fields	Apr 1, 2024	3D Object DetectionNeRF	CodeCode Available	2
SeaBird: Segmentation in Bird's View with Dice Loss Improves Monocular 3D Detection of Large Objects	Mar 29, 2024	3D Object Detection3D Object Detection From Monocular Images	CodeCode Available	2
OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation	Mar 28, 2024	3D Object DetectionNovel Class Discovery	CodeCode Available	2
Is Your LiDAR Placement Optimized for 3D Scene Understanding?	Mar 25, 2024	3D Object DetectionLIDAR Semantic Segmentation	CodeCode Available	2
RCooper: A Real-world Large-scale Dataset for Roadside Cooperative Perception	Mar 15, 2024	3D Object Detection3D Object Tracking	CodeCode Available	2
MIM4D: Masked Modeling with Multi-View Video for Autonomous Driving Representation Learning	Mar 13, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
LISO: Lidar-only Self-Supervised 3D Object Detection	Mar 11, 2024	3D Object DetectionObject	CodeCode Available	2
SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection	Mar 9, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
EMIFF: Enhanced Multi-scale Image Feature Fusion for Vehicle-Infrastructure Cooperative 3D Object Detection	Feb 23, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
MultiCorrupt: A Multi-Modal Robustness Dataset and Benchmark of LiDAR-Camera Fusion for 3D Object Detection	Feb 18, 2024	3D Object DetectionDataset Generation	CodeCode Available	2
Ray Denoising: Depth-aware Hard Negative Sampling for Multi-view 3D Object Detection	Feb 6, 2024	3D Object DetectionDenoising	CodeCode Available	2
LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object Detection	Jan 29, 2024	3D Object DetectionAutonomous Vehicles	CodeCode Available	2
MixSup: Mixed-grained Supervision for Label-efficient LiDAR-based 3D Object Detection	Jan 29, 2024	3D Object Detectionobject-detection	CodeCode Available	2
RoboFusion: Towards Robust Multi-Modal 3D Object Detection via SAM	Jan 8, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
WidthFormer: Toward Efficient Transformer-based BEV View Transformation	Jan 8, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
OneFormer3D: One Transformer for Unified Point Cloud Segmentation	Nov 24, 2023	3D Instance Segmentation3D Object Detection	CodeCode Available	2
FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin	Nov 18, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm	Oct 12, 2023	3D Object Detection3D Reconstruction	CodeCode Available	2
UniPAD: A Universal Pre-training Paradigm for Autonomous Driving	Oct 12, 2023	3D Object Detection3D Semantic Segmentation	CodeCode Available	2
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection	Oct 4, 2023	3D Object Detectioncross-modal alignment	CodeCode Available	2
SparseBEV: High-Performance Sparse 3D Object Detection from Multi-Camera Videos	Aug 18, 2023	3D Object DetectionObject	CodeCode Available	2
UniTR: A Unified and Efficient Multi-Modal Transformer for Bird's-Eye-View Representation	Aug 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
FocalFormer3D : Focusing on Hard Instance for 3D Object Detection	Aug 8, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
NeRF-Det: Learning Geometry-Aware Volumetric Representation for Multi-View 3D Object Detection	Jul 27, 2023	3D geometry3D Object Detection	CodeCode Available	2
Aria Digital Twin: A New Benchmark Dataset for Egocentric 3D Machine Perception	Jun 10, 2023	3D Object DetectionBenchmarking	CodeCode Available	2
DetZero: Rethinking Offboard 3D Object Detection with Long-term Sequential Point Clouds	Jun 9, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
SAM3D: Zero-Shot 3D Object Detection via Segment Anything Model	Jun 4, 2023	3D Object DetectionImage Segmentation	CodeCode Available	2
UniScene: Multi-Camera Unified Pre-training via 3D Scene Reconstruction for Autonomous Driving	May 30, 2023	3D Object Detection3D Scene Reconstruction	CodeCode Available	2
PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR Point Clouds	May 8, 2023	2D Object Detection3D Object Detection	CodeCode Available	2
OctFormer: Octree-based Transformers for 3D Point Clouds	May 4, 2023	3D Object Detection3D Semantic Segmentation	CodeCode Available	2
TaskPrompter: Spatial-Channel Multi-Task Prompting for Dense Scene Understanding	May 1, 2023	3D Object DetectionMonocular Depth Estimation	CodeCode Available	2
SparseFusion: Fusing Multi-Modal Sparse Representations for Multi-Sensor 3D Object Detection	Apr 27, 2023	3D Object Detectionobject-detection	CodeCode Available	2
Swin3D: A Pretrained Transformer Backbone for 3D Indoor Scene Understanding	Apr 14, 2023	3D Object DetectionScene Understanding	CodeCode Available	2
Joint 2D-3D Multi-Task Learning on Cityscapes-3D: 3D Detection, Segmentation, and Depth Estimation	Apr 3, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
EA-LSS: Edge-aware Lift-splat-shot Framework for 3D BEV Object Detection	Mar 31, 2023	3D Object DetectionDepth Estimation	CodeCode Available	2
Spherical Transformer for LiDAR-based 3D Recognition	Mar 22, 2023	3D Object Detection3D Semantic Segmentation	CodeCode Available	2
Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D Object Detection	Mar 21, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking	Mar 20, 2023	3D Object DetectionObject	CodeCode Available	2
A Simple Framework for 3D Occupancy Estimation in Autonomous Driving	Mar 17, 2023	3D Object Detection3D Reconstruction	CodeCode Available	2
BEVHeight: A Robust Framework for Vision-based Roadside 3D Object Detection	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
DiffBEV: Conditional Diffusion Model for Bird's Eye View Perception	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
V2V4Real: A Real-world Large-scale Dataset for Vehicle-to-Vehicle Cooperative Perception	Mar 14, 2023	3D Object Detection3D Object Tracking	CodeCode Available	2

Show:10 25 50

← PrevPage 2 of 32Next →

All datasets nuScenes ScanNetV2 SUN-RGBD val KITTI Cars Easy KITTI Cars Hard nuScenes Camera Only KITTI Cars Easy val KITTI Cars Moderate val nuscenes Camera-Radar View-of-Delft (val)KITTI Cars Hard val DAIR-V2X-I

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EA-LSS	NDS	0.78	—	Unverified
2	MegFusion	NDS	0.77	—	Unverified
3	MMFusion-e	NDS	0.77	—	Unverified
4	BEVFusion-e	NDS	0.76	—	Unverified
5	RacoonPower	NDS	0.76	—	Unverified
6	DeepInteraction-large	NDS	0.76	—	Unverified
7	DeepInteraction-e	NDS	0.76	—	Unverified
8	FusionVPE	NDS	0.75	—	Unverified
9	FocalFormer3D-F	NDS	0.75	—	Unverified
10	CenterPoint-Fusion	NDS	0.75	—	Unverified