Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 617 papers

Title	Date	Tasks	Status	Hype
Rethinking the Route Towards Weakly Supervised Object Localization	Feb 26, 2020	General ClassificationObject	CodeCode Available	1
Evaluating Weakly Supervised Object Localization Methods Right	Jan 21, 2020	Few-Shot LearningModel Selection	CodeCode Available	1
Building Calibrated Deep Models via Uncertainty Matching with Auxiliary Interval Predictors	Sep 9, 2019	Object LocalizationPrediction	CodeCode Available	1
Min-max Entropy for Weakly Supervised Pointwise Localization	Jul 25, 2019	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features	May 13, 2019	Domain GeneralizationImage Captioning	CodeCode Available	1
Learning to Augment Synthetic Images for Sim2Real Policy Transfer	Mar 18, 2019	Object Localization	CodeCode Available	1
Unsupervised Traffic Accident Detection in First-Person Videos	Mar 2, 2019	Anomaly DetectionAutonomous Driving	CodeCode Available	1
Transfer learning for time series classification	Nov 5, 2018	ClassificationDynamic Time Warping	CodeCode Available	1
Bounding Box Regression with Uncertainty for Accurate Object Detection	Sep 23, 2018	Objectobject-detection	CodeCode Available	1
Locating Objects Without Bounding Boxes	Jun 20, 2018	ObjectObject Localization	CodeCode Available	1
Frustum PointNets for 3D Object Detection from RGB-D Data	Nov 22, 2017	3D Object DetectionObject	CodeCode Available	1
VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection	Nov 17, 2017	3D Object DetectionBirds Eye View Object Detection	CodeCode Available	1
Grad-CAM++: Improved Visual Explanations for Deep Convolutional Networks	Oct 30, 2017	3D Action RecognitionAction Recognition	CodeCode Available	1
Mask R-CNN	Mar 20, 2017	3D Instance SegmentationHuman Part Segmentation	CodeCode Available	1
Learning Deep Features for Discriminative Localization	Dec 14, 2015	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
LocNet: Improving Localization Accuracy for Object Detection	Nov 24, 2015	Objectobject-detection	CodeCode Available	1
Efficient Object Localization Using Convolutional Networks	Nov 16, 2014	ObjectObject Localization	CodeCode Available	1
Microsoft COCO: Common Objects in Context	May 1, 2014	Instance SegmentationObject	CodeCode Available	1
Mask-aware Text-to-Image Retrieval: Referring Expression Segmentation Meets Cross-modal Retrieval	Jun 28, 2025	Cross-Modal RetrievalImage Captioning	—Unverified	0
VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding	Jun 28, 2025	3DGSInstance Segmentation	—Unverified	0
RAG-6DPose: Retrieval-Augmented 6D Pose Estimation via Leveraging CAD as Knowledge Base	Jun 23, 2025	6D Pose EstimationObject Localization	—Unverified	0
CDP: Towards Robust Autoregressive Visuomotor Policy Learning via Causal Diffusion	Jun 17, 2025	Object Localization	—Unverified	0
UAV Object Detection and Positioning in a Mining Industrial Metaverse with Custom Geo-Referenced Data	Jun 16, 2025	3D Reconstructionobject-detection	—Unverified	0
WoMAP: World Models For Embodied Open-Vocabulary Object Localization	Jun 2, 2025	Active Object LocalizationEfficient Exploration	—Unverified	0
Multispectral Detection Transformer with Infrared-Centric Sensor Fusion	May 21, 2025	Multispectral Object DetectionObject	CodeCode Available	0
Ground-V: Teaching VLMs to Ground Complex Instructions in Pixels	May 20, 2025	Instruction FollowingKnowledge Distillation	—Unverified	0
Towards Omnidirectional Reasoning with 360-R1: A Dataset, Benchmark, and GRPO-based Method	May 20, 2025	HallucinationObject Localization	—Unverified	0
PointArena: Probing Multimodal Grounding Through Language-Guided Pointing	May 15, 2025	Object Localization	—Unverified	0
Towards Accurate State Estimation: Kalman Filter Incorporating Motion Dynamics for 3D Multi-Object Tracking	May 12, 2025	3D Multi-Object TrackingMulti-Object Tracking	—Unverified	0
Enhancing Satellite Object Localization with Dilated Convolutions and Attention-aided Spatial Pooling	May 8, 2025	feature selectionObject	CodeCode Available	0
Split Matching for Inductive Zero-shot Semantic Segmentation	May 8, 2025	Object LocalizationSemantic Segmentation	—Unverified	0
Pro2SAM: Mask Prompt to SAM with Grid Points for Weakly Supervised Object Localization	May 8, 2025	Object LocalizationWeakly-Supervised Object Localization	—Unverified	0
Exploring Modality Guidance to Enhance VFM-based Feature Fusion for UDA in 3D Semantic Segmentation	Apr 19, 2025	3D Semantic Segmentationimage-classification	—Unverified	0
CFIS-YOLO: A Lightweight Multi-Scale Fusion Network for Edge-Deployable Wood Defect Detection	Apr 15, 2025	Computational EfficiencyDefect Detection	—Unverified	0
Foundation Models for Remote Sensing: An Analysis of MLLMs for Object Localization	Apr 14, 2025	BenchmarkingEarth Observation	—Unverified	0
Multi-Object Grounding via Hierarchical Contrastive Siamese Transformers	Apr 14, 2025	ObjectObject Localization	—Unverified	0
POEM: Precise Object-level Editing via MLLM control	Apr 10, 2025	Image GenerationObject	—Unverified	0
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition	Mar 31, 2025	Few-Shot LearningFont Recognition	CodeCode Available	0
MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing	Mar 31, 2025	Objectobject-detection	CodeCode Available	0
PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization	Mar 31, 2025	image-classificationImage Classification	CodeCode Available	0
GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection	Mar 26, 2025	Common Sense ReasoningObject	—Unverified	0
Beyond Object Categories: Multi-Attribute Reference Understanding for Visual Grounding	Mar 25, 2025	AttributeObject	—Unverified	0
xMOD: Cross-Modal Distillation for 2D/3D Multi-Object Discovery from 2D motion	Mar 19, 2025	Multi-object discoveryObject	CodeCode Available	0
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration	Feb 23, 2025	3DGS3D Semantic Segmentation	—Unverified	0
MomentSeeker: A Task-Oriented Benchmark For Long-Video Moment Retrieval	Feb 18, 2025	Action RecognitionMoment Retrieval	—Unverified	0
Auto-Prompting SAM for Weakly Supervised Landslide Extraction	Jan 23, 2025	Landslide segmentationObject Localization	—Unverified	0
TeD-Loc: Text Distillation for Weakly Supervised Object Localization	Jan 22, 2025	ClassificationDenoising	CodeCode Available	0
Neuromorphic Optical Tracking and Imaging of Randomly Moving Targets through Strongly Scattering Media	Jan 7, 2025	Computational EfficiencyImage Reconstruction	—Unverified	0
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features	Jan 7, 2025	3D Object DetectionComputational Efficiency	—Unverified	0
Cross-Modal Distillation for 2D/3D Multi-Object Discovery from 2D Motion	Jan 1, 2025	Multi-object discoveryObject	—Unverified	0

Show:10 25 50

← PrevPage 4 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified