Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 617 papers

Title	Date	Tasks	Status	Hype
Distilling Knowledge from Refinement in Multiple Instance Detection Networks	Apr 23, 2020	Knowledge DistillationMultiple Instance Learning	CodeCode Available	1
A Generic Visualization Approach for Convolutional Neural Networks	Jul 19, 2020	ClassificationGeneral Classification	CodeCode Available	1
OCDet: Object Center Detection via Bounding Box-Aware Heatmap Prediction on Edge Devices with NPUs	Nov 23, 2024	Keypoint DetectionObject	CodeCode Available	1
Few-Shot Object Detection via Variational Feature Aggregation	Jan 31, 2023	Few-Shot Object DetectionMeta-Learning	CodeCode Available	1
Online Refinement of Low-level Feature Based Activation Map for Weakly Supervised Object Localization	Oct 12, 2021	ObjectObject Localization	CodeCode Available	1
Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance	Dec 17, 2023	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	CodeCode Available	1
CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud	Dec 5, 2020	3D Object DetectionBirds Eye View Object Detection	CodeCode Available	1
Optical Flow boosts Unsupervised Localization and Segmentation	Jul 25, 2023	Lifelong learningObject	CodeCode Available	1
InstanceRefer: Cooperative Holistic Understanding for Visual Grounding on Point Clouds through Instance Multi-level Contextual Referring	Mar 1, 2021	3D visual groundingAttribute	CodeCode Available	1
Dual-attention Guided Dropblock Module for Weakly Supervised Object Localization	Mar 9, 2020	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation	Dec 21, 2023	Edge DetectionFeature Engineering	CodeCode Available	1
Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation	Dec 9, 2024	Object LocalizationVision and Language Navigation	CodeCode Available	1
Dual Progressive Transformations for Weakly Supervised Semantic Segmentation	Sep 30, 2022	Inductive BiasObject	CodeCode Available	1
Learning Deep Features for Discriminative Localization	Dec 14, 2015	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
Meta-DETR: Image-Level Few-Shot Object Detection with Inter-Class Correlation Exploitation	Mar 22, 2021	Few-Shot Object DetectionMeta-Learning	CodeCode Available	1
EDN: Salient Object Detection via Extremely-Downsampled Network	Dec 24, 2020	DecoderObject	CodeCode Available	1
MUSTER: A Multi-scale Transformer-based Decoder for Semantic Segmentation	Nov 25, 2022	DecoderObject Localization	CodeCode Available	1
Egocentric Audio-Visual Object Localization	Mar 23, 2023	ObjectObject Localization	CodeCode Available	1
Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey	May 26, 2021	Objectobject-detection	—Unverified	0
Bootstrapping Labelled Dataset Construction for Cow Tracking and Behavior Analysis	Mar 30, 2017	Instance SegmentationObject	—Unverified	0
Deep learning architectures for automated image segmentation	Sep 19, 2019	Boundary DetectionDecoder	—Unverified	0
Deep Joint Task Learning for Generic Object Extraction	Feb 3, 2015	ObjectObject Localization	—Unverified	0
How hard can it be? Estimating the difficulty of visual search in an image	May 23, 2017	Object LocalizationWeakly-Supervised Object Localization	—Unverified	0
Deep Contextual Attention for Human-Object Interaction Detection	Oct 17, 2019	Human-Object Interaction DetectionObject	—Unverified	0
DeepAdaIn-Net: Deep Adaptive Device-Edge Collaborative Inference for Augmented Reality	Sep 22, 2023	Collaborative InferenceFeature Compression	—Unverified	0
Adaptively Denoising Proposal Collection for Weakly Supervised Object Localization	Oct 4, 2019	DenoisingMultiple Instance Learning	—Unverified	0
How semantic and geometric information mutually reinforce each other in ToF object localization	Aug 27, 2020	ObjectObject Localization	—Unverified	0
Modelling Lips-State Detection Using CNN for Non-Verbal Communications	Dec 9, 2021	License Plate DetectionLicense Plate Recognition	—Unverified	0
An Application of Deep Learning for Sweet Cherry Phenotyping using YOLO Object Detection	Feb 13, 2023	object-detectionObject Detection	—Unverified	0
D2DF2WOD: Learning Object Proposals for Weakly-Supervised Object Detection via Progressive Domain Adaptation	Dec 2, 2022	Domain AdaptationObject	—Unverified	0
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments	Jul 25, 2024	Object Localization	—Unverified	0
Adaptively Denoising Proposal Collection forWeakly Supervised Object Localization	Oct 4, 2019	DenoisingMultiple Instance Learning	—Unverified	0
Cyclic Learning for Binaural Audio Generation and Localization	Jan 1, 2024	Audio GenerationObject	—Unverified	0
BirdSLAM: Monocular Multibody SLAM in Bird's-Eye View	Nov 15, 2020	Autonomous DrivingMonocular Reconstruction	—Unverified	0
A Model Generalization Study in Localizing Indoor Cows with COw LOcalization (COLO) dataset	Jul 29, 2024	Data AugmentationObject Localization	—Unverified	0
Evaluating and Enhancing Trustworthiness of LLMs in Perception Tasks	Jul 18, 2024	Hallucinationobject-detection	—Unverified	0
How spatial frequencies and color drive object search in real-world scenes: A new eye-movement corpus	Mar 20, 2020	ObjectObject Localization	—Unverified	0
Cross-Modal Distillation for 2D/3D Multi-Object Discovery from 2D Motion	Jan 1, 2025	Multi-object discoveryObject	—Unverified	0
Beyond Object Categories: Multi-Attribute Reference Understanding for Visual Grounding	Mar 25, 2025	AttributeObject	—Unverified	0
A Memory-Augmented Multi-Task Collaborative Framework for Unsupervised Traffic Accident Detection in Driving Videos	Jul 27, 2023	Autonomous DrivingObject	—Unverified	0
CPR++: Object Localization via Single Coarse Point Supervision	Jan 30, 2024	ObjectObject Localization	—Unverified	0
Adaptive Label Smoothing	Sep 14, 2020	General ClassificationObject Localization	—Unverified	0
Could We Generate Cytology Images from Histopathology Images? An Empirical Study	Mar 16, 2024	Data AugmentationImage-to-Image Translation	—Unverified	0
A Markerless Deep Learning-based 6 Degrees of Freedom PoseEstimation for with Mobile Robots using RGB Data	Jan 16, 2020	Data VisualizationObject Localization	—Unverified	0
Hierarchical Complementary Learning for Weakly Supervised Object Localization	Nov 16, 2020	ObjectObject Localization	—Unverified	0
HiLM-D: Towards High-Resolution Understanding in Multimodal Large Language Models for Autonomous Driving	Sep 11, 2023	Autonomous DrivingObject Localization	—Unverified	0
Cooperative Multi-Monostatic Sensing for Object Localization in 6G Networks	Nov 24, 2023	Object Localization	—Unverified	0
Adapting Mask-RCNN for Automatic Nucleus Segmentation	May 1, 2018	Instance SegmentationObject	—Unverified	0
Few-shot Geometry-Aware Keypoint Localization	Mar 30, 2023	3D geometryObject Localization	—Unverified	0
3DCNN-DQN-RNN: A Deep Reinforcement Learning Framework for Semantic Parsing of Large-scale 3D Point Clouds	Jul 21, 2017	ClassificationDeep Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 4 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified