Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 617 papers

Title	Date	Tasks	Status
Who Make Drivers Stop? Towards Driver-centric Risk Assessment: Risk Object Identification via Causal Inference	Mar 5, 2020	Causal InferenceObject	—Unverified
Parity Models: A General Framework for Coding-Based Resilience in ML Inference	May 2, 2019	BIG-bench Machine Learningimage-classification	—Unverified
Particle filter re-detection for visual tracking via correlation filters	Nov 28, 2017	ObjectObject Localization	—Unverified
Parts-Based Articulated Object Localization in Clutter Using Belief Propagation	Aug 6, 2020	ObjectObject Localization	—Unverified
PBRnet: Pyramidal Bounding Box Refinement to Improve Object Localization Accuracy	Mar 10, 2020	Object Localization	—Unverified
Photorealistic Image Synthesis for Object Instance Detection	Feb 9, 2019	6D Pose Estimation6D Pose Estimation using RGB	—Unverified
Plenoptic Monte Carlo Object Localization for Robot Grasping under Layered Translucency	Jun 26, 2018	Object LocalizationTransparent objects	—Unverified
PMR-Net: Parallel Multi-Resolution Encoder-Decoder Network Framework for Medical Image Segmentation	Sep 19, 2024	DecoderImage Segmentation	—Unverified
POEM: Precise Object-level Editing via MLLM control	Apr 10, 2025	Image GenerationObject	—Unverified
PointArena: Probing Multimodal Grounding Through Language-Guided Pointing	May 15, 2025	Object Localization	—Unverified
Point Cloud Registration-Driven Robust Feature Matching for 3D Siamese Object Tracking	Sep 14, 2022	Object LocalizationObject Tracking	—Unverified
Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection	Mar 22, 2024	3D Object Detectionobject-detection	—Unverified
Video Instance Segmentation by Instance Flow Assembly	Oct 20, 2021	Instance SegmentationObject	—Unverified
3D Spatial Understanding in MLLMs: Disambiguation and Evaluation	Dec 9, 2024	3D dense captioning3D visual grounding	—Unverified
Polyp-artifact relationship analysis using graph inductive learned representations	Sep 15, 2020	Graph Representation LearningObject Localization	—Unverified
Practical, Fast and Robust Point Cloud Registration for 3D Scene Stitching and Object Localization	Nov 8, 2021	3D Feature MatchingBenchmarking	—Unverified
Prediction Accuracy & Reliability: Classification and Object Localization under Distribution Shift	Sep 5, 2024	Autonomous DrivingBenchmarking	—Unverified
3D Object Localization Using 2D Estimates for Computer Vision Applications	Sep 24, 2020	Camera CalibrationObject	—Unverified
Pro2SAM: Mask Prompt to SAM with Grid Points for Weakly Supervised Object Localization	May 8, 2025	Object LocalizationWeakly-Supervised Object Localization	—Unverified
Probing the Mid-level Vision Capabilities of Self-Supervised Learning	Nov 25, 2024	Object LocalizationSelf-Supervised Learning	—Unverified
Probing the Role of Positional Information in Vision-Language Models	Jan 16, 2022	Contrastive LearningImage-text matching	—Unverified
Probing the Role of Positional Information in Vision-Language Models	May 17, 2023	Contrastive LearningImage-text matching	—Unverified
Video OWL-ViT: Temporally-consistent open-world localization in video	Aug 22, 2023	DecoderObject	—Unverified
Generalized Coarse-to-Fine Visual Recognition with Progressive Training	Nov 29, 2018	image-classificationImage Classification	—Unverified
Vision-based Real-Time Aerial Object Localization and Tracking for UAV Sensing System	Mar 19, 2017	Objectobject-detection	—Unverified
Query-guided Attention in Vision Transformers for Localizing Objects Using a Single Sketch	Mar 15, 2023	Objectobject-detection	—Unverified
RAG-6DPose: Retrieval-Augmented 6D Pose Estimation via Leveraging CAD as Knowledge Base	Jun 23, 2025	6D Pose EstimationObject Localization	—Unverified
R-AGNO-RPN: A LIDAR-Camera Region Deep Network for Resolution-Agnostic Detection	Dec 10, 2020	3D Object DetectionData Augmentation	—Unverified
Rapid Training Data Creation by Synthesizing Medical Images for Classification and Localization	Aug 9, 2023	Medical Image AnalysisObject Localization	—Unverified
Real-time Full-stack Traffic Scene Perception for Autonomous Driving with Roadside Cameras	Jun 20, 2022	Autonomous DrivingEdge-computing	—Unverified
Real-world Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning	Apr 15, 2024	Contrastive LearningDeblurring	—Unverified
Evaluating and Enhancing Trustworthiness of LLMs in Perception Tasks	Jul 18, 2024	Hallucinationobject-detection	—Unverified
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning	Nov 15, 2024	DescriptiveObject	—Unverified
Visually Guided Spatial Relation Extraction from Text	Jun 1, 2018	Activity RecognitionImage Captioning	—Unverified
Deep Learning Methods and Applications for Region of Interest Detection in Dermoscopic Images	Jul 27, 2018	Data Augmentationobject-detection	—Unverified
RELOCATE: A Simple Training-Free Baseline for Visual Query Localization Using Region-Based Representations	Dec 2, 2024	Object Localization	—Unverified
3DCNN-DQN-RNN: A Deep Reinforcement Learning Framework for Semantic Parsing of Large-scale 3D Point Clouds	Jul 21, 2017	ClassificationDeep Reinforcement Learning	—Unverified
Visuomotor Control in Multi-Object Scenes Using Object-Aware Representations	May 12, 2022	ObjectObject Localization	—Unverified
Why is plausibility surprisingly problematic as an XAI criterion?	Mar 30, 2023	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Rethinking the Localization in Weakly Supervised Object Localization	Aug 11, 2023	ObjectObject Localization	—Unverified
VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding	Jun 28, 2025	3DGSInstance Segmentation	—Unverified
Foveated Retinotopy Improves Classification and Localization in CNNs	Feb 23, 2024	ClassificationImage Categorization	—Unverified
WoMAP: World Models For Embodied Open-Vocabulary Object Localization	Jun 2, 2025	Active Object LocalizationEfficient Exploration	—Unverified
Revisiting Dilated Convolution: A Simple Approach for Weakly- and Semi-Supervised Semantic Segmentation	Jun 1, 2018	ClassificationGeneral Classification	—Unverified
Revisiting Dilated Convolution: A Simple Approach for Weakly- and Semi- Supervised Semantic Segmentation	May 11, 2018	ObjectObject Localization	—Unverified
1-HKUST: Object Detection in ILSVRC 2014	Sep 22, 2014	Objectobject-detection	—Unverified
3D-Aware Object Localization using Gaussian Implicit Occupancy Function	Mar 3, 2023	ObjectObject Localization	—Unverified
Weakly Supervised Foreground Learning for Weakly Supervised Localization and Detection	Aug 3, 2021	Object LocalizationWeakly-Supervised Object Localization	—Unverified
Robust Scale Estimation in Real-Time Monocular SFM for Autonomous Driving	Jun 1, 2014	Autonomous DrivingObject	—Unverified
ROML: A Robust Feature Correspondence Approach for Matching Objects in A Set of Images	Mar 31, 2014	3D ReconstructionDistributed Optimization	—Unverified

Show:10 25 50

← PrevPage 8 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified