Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 10957 papers

Title	Date	Tasks	Status	Hype
Drones Help Drones: A Collaborative Framework for Multi-Drone Object Trajectory Prediction and Beyond	May 23, 2024	3D Object Detectionobject-detection	CodeCode Available	2
Global Context Vision Transformers	Jun 20, 2022	image-classificationImage Classification	CodeCode Available	2
GOReloc: Graph-based Object-Level Relocalization for Visual SLAM	Aug 15, 2024	Objectobject-detection	CodeCode Available	2
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2
A DeNoising FPN With Transformer R-CNN for Tiny Object Detection	Jun 9, 2024	Contrastive LearningDenoising	CodeCode Available	2
Grounded 3D-LLM with Referent Tokens	May 16, 2024	Dense CaptioningDiversity	CodeCode Available	2
ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks	Oct 8, 2019	Dimensionality Reductionimage-classification	CodeCode Available	2
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2
Attention Mechanisms in Computer Vision: A Survey	Nov 15, 2021	image-classificationImage Classification	CodeCode Available	2
HazyDet: Open-source Benchmark for Drone-view Object Detection with Depth-cues in Hazy Scenes	Sep 30, 2024	Objectobject-detection	CodeCode Available	2
HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras	Apr 3, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
HGSFusion: Radar-Camera Fusion with Hybrid Generation and Synchronization for 3D Object Detection	Dec 16, 2024	3D Object Detection3D Object Detection on View-of-Delft (val)	CodeCode Available	2
HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions	Jul 28, 2022	Image ClassificationObject Detection	CodeCode Available	2
MobileOne: An Improved One millisecond Mobile Backbone	Jun 8, 2022	Efficient Neural NetworkGaze Estimation	CodeCode Available	2
Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression	Nov 19, 2019	object-detectionObject Detection	CodeCode Available	2
HybridNets: End-to-End Perception Network	Mar 17, 2022	Autonomous DrivingDrivable Area Detection	CodeCode Available	2
ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer	Mar 8, 2022	Image Classificationobject-detection	CodeCode Available	2
Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data	Mar 30, 2022	3D Object Detection3D Semantic Segmentation	CodeCode Available	2
Improving CLIP Fine-tuning Performance	Jan 1, 2023	Diagnosticobject-detection	CodeCode Available	2
EMIFF: Enhanced Multi-scale Image Feature Fusion for Vehicle-Infrastructure Cooperative 3D Object Detection	Feb 23, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
Fast-iTPN: Integrally Pre-Trained Transformer Pyramid Network with Token Migration	Nov 23, 2022	object-detectionObject Detection	CodeCode Available	2
An Empirical Study of Remote Sensing Pretraining	Apr 6, 2022	Aerial Scene ClassificationBuilding change detection for remote sensing images	CodeCode Available	2
Is CLIP the main roadblock for fine-grained open-world perception?	Apr 4, 2024	Autonomous DrivingNovel Concepts	CodeCode Available	2
DiffusionTrack: Diffusion Model For Multi-Object Tracking	Aug 19, 2023	Denoisingmodel	CodeCode Available	2
K-Radar: 4D Radar Object Detection for Autonomous Driving in Various Weather Conditions	Jun 16, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
L4DR: LiDAR-4DRadar Fusion for Weather-Robust 3D Object Detection	Aug 7, 2024	3D Object DetectionAutonomous Navigation	CodeCode Available	2
DFormer: Rethinking RGBD Representation Learning for Semantic Segmentation	Sep 18, 2023	3D geometryDecoder	CodeCode Available	2
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction	Jul 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
Large Self-Supervised Models Bridge the Gap in Domain Adaptive Object Detection	Mar 29, 2025	object-detectionObject Detection	CodeCode Available	2
Learning Embeddings with Centroid Triplet Loss for Object Identification in Robotic Grasping	Apr 9, 2024	Image RetrievalObject	CodeCode Available	2
DEYOLO: Dual-Feature-Enhancement YOLO for Cross-Modality Object Detection	Dec 6, 2024	Objectobject-detection	CodeCode Available	2
DiffBEV: Conditional Diffusion Model for Bird's Eye View Perception	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2
Dilated Neighborhood Attention Transformer	Sep 29, 2022	Image ClassificationInstance Segmentation	CodeCode Available	2
DetZero: Rethinking Offboard 3D Object Detection with Long-term Sequential Point Clouds	Jun 9, 2023	3D Multi-Object Tracking3D Object Detection	CodeCode Available	2
DEVIANT: Depth EquiVarIAnt NeTwork for Monocular 3D Object Detection	Jul 21, 2022	3D Object Detection3D Object Detection From Monocular Images	CodeCode Available	2
DETR Does Not Need Multi-Scale or Locality Design	Jan 1, 2023	DecoderObject Detection	CodeCode Available	2
DetGPT: Detect What You Need via Reasoning	May 23, 2023	Autonomous DrivingObject	CodeCode Available	2
DEYO: DETR with YOLO for End-to-End Object Detection	Feb 26, 2024	DecoderGPU	CodeCode Available	2
DI-MaskDINO: A Joint Object Detection and Instance Segmentation Model	Oct 22, 2024	DecoderInstance Segmentation	CodeCode Available	2
Detection in Crowded Scenes: One Proposal, Multiple Predictions	Mar 20, 2020	Object DetectionPedestrian Detection	CodeCode Available	2
BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework	May 27, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
Masked Generative Distillation	May 3, 2022	image-classificationImage Classification	CodeCode Available	2
Detecting Everything in the Open World: Towards Universal Object Detection	Mar 21, 2023	object-detectionObject Detection	CodeCode Available	2
Detect-Order-Construct: A Tree Construction based Approach for Hierarchical Document Structure Analysis	Jan 22, 2024	Document Layout AnalysisDocument Summarization	CodeCode Available	2
Detect Everything with Few Examples	Sep 22, 2023	Binary ClassificationCross-Domain Few-Shot Object Detection	CodeCode Available	2
BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection	Jun 21, 2022	3D Object DetectionDepth Estimation	CodeCode Available	2
BEVerse: Unified Perception and Prediction in Birds-Eye-View for Vision-Centric Autonomous Driving	May 19, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	2
BEVDet: High-performance Multi-camera 3D Object Detection in Bird-Eye-View	Dec 22, 2021	3D Object DetectionAutonomous Driving	CodeCode Available	2
DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution	Jun 3, 2020	Instance SegmentationObject	CodeCode Available	2
Dense Distinct Query for End-to-End Object Detection	Mar 22, 2023	Objectobject-detection	CodeCode Available	2

Show:10 25 50

← PrevPage 8 of 220Next →

All datasets COCO test-dev COCO minival COCO-O COCO 2017 val PASCAL VOC 2007 COCO 2017 CrowdHuman (full body)CPPE-5 LVIS v1.0 val Manga109-s 15test PKU-DDD17-Car Waymo 2D detection all_ns f0val

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Co-DETR	box mAP	66	—	Unverified
2	InternImage-H (M3I Pre-training)	box mAP	65.5	—	Unverified
3	M3I Pre-training (InternImage-H)	box mAP	65.4	—	Unverified
4	MoCaE	box mAP	65.1	—	Unverified
5	Co-DETR (Swin-L)	box mAP	64.8	—	Unverified
6	Focal-Stable-DINO (Focal-Huge, no TTA)	box mAP	64.8	—	Unverified
7	EVA	box mAP	64.7	—	Unverified
8	Group DETR v2	box mAP	64.5	—	Unverified
9	FocalNet-H (DINO)	box mAP	64.4	—	Unverified
10	InternImage-XL	box mAP	64.3	—	Unverified