Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 617 papers

Title	Date	Tasks	Status	Hype	Score
Qwen2.5-VL Technical Report	Feb 19, 2025	document understanding	CodeCode Available	11	5
Bilateral Reference for High-Resolution Dichotomous Image Segmentation	Jan 7, 2024	Camouflaged Object SegmentationDichotomous Image Segmentation	CodeCode Available	7	5
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks	Jun 12, 2024	Image GenerationLanguage Modeling	CodeCode Available	5	5
Mamba-FETrack: Frame-Event Tracking via State Space Model	Apr 28, 2024	GPUMamba	CodeCode Available	4	5
The All-Seeing Project V2: Towards General Relation Comprehension of the Open World	Feb 29, 2024	AllHallucination	CodeCode Available	4	5
Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models	Feb 12, 2024	HallucinationObject Localization	CodeCode Available	4	5
LangSplat: 3D Language Gaussian Splatting	Dec 26, 2023	NeRFObject Localization	CodeCode Available	3	5
DynaMem: Online Dynamic Spatio-Semantic Memory for Open World Mobile Manipulation	Nov 7, 2024	Object Localization	CodeCode Available	3	5
CrossOver: 3D Scene Cross-Modal Alignment	Feb 20, 2025	cross-modal alignmentObject	CodeCode Available	3	5
Locate 3D: Real-World Object Localization via Self-Supervised Learning in 3D	Apr 19, 2025	DecoderObject Localization	CodeCode Available	3	5
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection	Oct 4, 2023	3D Object Detectioncross-modal alignment	CodeCode Available	2	5
Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localization and Semantic Segmentation	Mar 25, 2022	Contrastive Learningimage-classification	CodeCode Available	2	5
Omnidirectional Multi-Object Tracking	Mar 6, 2025	Multi-Object TrackingObject	CodeCode Available	2	5
Crafting Better Contrastive Views for Siamese Representation Learning	Feb 7, 2022	Contrastive LearningObject Localization	CodeCode Available	2	5
BOP Challenge 2020 on 6D Object Localization	Sep 15, 2020	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available	2	5
C2AM: Contrastive Learning of Class-Agnostic Activation Map for Weakly Supervised Object Localization and Semantic Segmentation	Jan 1, 2022	Contrastive Learningimage-classification	CodeCode Available	2	5
Point Segment and Count: A Generalized Framework for Object Counting	Jan 1, 2024	Few-shot Object Counting and DetectionKnowledge Distillation	CodeCode Available	2	5
Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection	Jan 19, 2024	Multispectral Object DetectionObject	CodeCode Available	2	5
A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation	Sep 27, 2024	Exemplar-Free CountingFew-shot Object Counting and Detection	CodeCode Available	2	5
Deep Snake for Real-Time Instance Segmentation	Jan 6, 2020	GPUInstance Segmentation	CodeCode Available	2	5
Kimera: from SLAM to Spatial Perception with 3D Dynamic Scene Graphs	Jan 18, 2021	3D ReconstructionObject Localization	CodeCode Available	2	5
Many-Shot In-Context Learning in Multimodal Foundation Models	May 16, 2024	image-classificationImage Classification	CodeCode Available	2	5
Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark	Nov 24, 2022	2D Object DetectionImage Retrieval	CodeCode Available	2	5
Context-Aware Entity Grounding with Open-Vocabulary 3D Scene Graphs	Sep 27, 2023	FormNavigate	CodeCode Available	1	5
Context-Aware 3D Object Localization from Single Calibrated Images: A Study of Basketballs	Sep 7, 2023	Autonomous DrivingCamera Calibration	CodeCode Available	1	5
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation	Dec 21, 2023	Edge DetectionFeature Engineering	CodeCode Available	1	5
Dual Progressive Transformations for Weakly Supervised Semantic Segmentation	Sep 30, 2022	Inductive BiasObject	CodeCode Available	1	5
Dual-attention Guided Dropblock Module for Weakly Supervised Object Localization	Mar 9, 2020	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1	5
An Attention-guided Multistream Feature Fusion Network for Localization of Risky Objects in Driving Videos	Sep 16, 2022	Anomaly DetectionObject	CodeCode Available	1	5
Anchor-free Small-scale Multispectral Pedestrian Detection	Aug 19, 2020	Autonomous DrivingData Augmentation	CodeCode Available	1	5
DETReg: Unsupervised Pretraining with Region Priors for Object Detection	Jun 8, 2021	Few-Shot LearningFew-Shot Object Detection	CodeCode Available	1	5
Discriminative Sounding Objects Localization via Self-supervised Audiovisual Matching	Oct 12, 2020	ObjectObject Localization	CodeCode Available	1	5
CLIP the Gap: A Single Domain Generalization Approach for Object Detection	Jan 13, 2023	Domain Generalizationimage-classification	CodeCode Available	1	5
Background Activation Suppression for Weakly Supervised Object Localization	Dec 1, 2021	ObjectObject Localization	CodeCode Available	1	5
A Low-Shot Object Counting Network With Iterative Prototype Adaptation	Nov 15, 2022	Exemplar-Free CountingObject	CodeCode Available	1	5
CoWs on Pasture: Baselines and Benchmarks for Language-Driven Zero-Shot Object Navigation	Mar 20, 2022	image-classificationImage Classification	CodeCode Available	1	5
Distilling Knowledge from Refinement in Multiple Instance Detection Networks	Apr 23, 2020	Knowledge DistillationMultiple Instance Learning	CodeCode Available	1	5
DAFNe: A One-Stage Anchor-Free Approach for Oriented Object Detection	Sep 13, 2021	object-detectionObject Detection	CodeCode Available	1	5
CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features	May 13, 2019	Domain GeneralizationImage Captioning	CodeCode Available	1	5
DanceTrack: Multi-Object Tracking in Uniform Appearance and Diverse Motion	Nov 29, 2021	Multi-Object TrackingObject	CodeCode Available	1	5
Audio-Visual Grouping Network for Sound Localization from Mixtures	Mar 29, 2023	Object LocalizationSound Source Localization	CodeCode Available	1	5
Class-aware Sounding Objects Localization via Audiovisual Correspondence	Dec 22, 2021	Objectobject-detection	CodeCode Available	1	5
Cross-Modal Weighting Network for RGB-D Salient Object Detection	Jul 9, 2020	object-detectionObject Detection	CodeCode Available	1	5
CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud	Dec 5, 2020	3D Object DetectionBirds Eye View Object Detection	CodeCode Available	1	5
Cascade-DETR: Delving into High-Quality Universal Object Detection	Jul 20, 2023	DecoderObject	CodeCode Available	1	5
CAM Back Again: Large Kernel CNNs from a Weakly Supervised Object Localization Perspective	Mar 11, 2024	Data AugmentationObject Localization	CodeCode Available	1	5
Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation	Dec 9, 2024	Object LocalizationVision and Language Navigation	CodeCode Available	1	5
Building Calibrated Deep Models via Uncertainty Matching with Auxiliary Interval Predictors	Sep 9, 2019	Object LocalizationPrediction	CodeCode Available	1	5
Background Activation Suppression for Weakly Supervised Object Localization and Semantic Segmentation	Sep 22, 2023	ObjectObject Localization	CodeCode Available	1	5
DeepCut: Unsupervised Segmentation using Graph Neural Networks Clustering	Dec 12, 2022	ClusteringGraph Neural Network	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified