Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 617 papers

Title	Date	Tasks	Status	Hype	Score
Distilling Knowledge from Refinement in Multiple Instance Detection Networks	Apr 23, 2020	Knowledge DistillationMultiple Instance Learning	CodeCode Available	1	5
A Generic Visualization Approach for Convolutional Neural Networks	Jul 19, 2020	ClassificationGeneral Classification	CodeCode Available	1	5
Keep CALM and Improve Visual Feature Attribution	Jun 15, 2021	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1	5
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models	Mar 23, 2024	Common Sense ReasoningIn-Context Learning	CodeCode Available	1	5
Integrated Grad-CAM: Sensitivity-Aware Visual Explanation of Deep Convolutional Networks via Integrated Gradient-Based Scoring	Feb 15, 2021	Object LocalizationSensitivity	CodeCode Available	1	5
TDAM: Top-Down Attention Module for Contextually Guided Feature Selection in CNNs	Nov 26, 2021	feature selectionImage Classification	CodeCode Available	1	5
Recognizing Vector Graphics without Rasterization	Nov 5, 2021	Graph Neural Networkobject-detection	CodeCode Available	1	5
InstanceRefer: Cooperative Holistic Understanding for Visual Grounding on Point Clouds through Instance Multi-level Contextual Referring	Mar 1, 2021	3D visual groundingAttribute	CodeCode Available	1	5
Transfer learning for time series classification	Nov 5, 2018	ClassificationDynamic Time Warping	CodeCode Available	1	5
Dual-attention Guided Dropblock Module for Weakly Supervised Object Localization	Mar 9, 2020	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1	5
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation	Dec 21, 2023	Edge DetectionFeature Engineering	CodeCode Available	1	5
Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation	Dec 9, 2024	Object LocalizationVision and Language Navigation	CodeCode Available	1	5
Dual Progressive Transformations for Weakly Supervised Semantic Segmentation	Sep 30, 2022	Inductive BiasObject	CodeCode Available	1	5
Context-Aware Entity Grounding with Open-Vocabulary 3D Scene Graphs	Sep 27, 2023	FormNavigate	CodeCode Available	1	5
Learning Deep Features for Discriminative Localization	Dec 14, 2015	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1	5
EDN: Salient Object Detection via Extremely-Downsampled Network	Dec 24, 2020	DecoderObject	CodeCode Available	1	5
Efficient Object Localization Using Convolutional Networks	Nov 16, 2014	ObjectObject Localization	CodeCode Available	1	5
Egocentric Audio-Visual Object Localization	Mar 23, 2023	ObjectObject Localization	CodeCode Available	1	5
Deep Learning for Identifying Iran's Cultural Heritage Buildings in Need of Conservation Using Image Classification and Grad-CAM	Feb 28, 2023	Data Augmentationimage-classification	CodeCode Available	0	5
Progressive Representation Adaptation for Weakly Supervised Object Localization	Oct 12, 2017	ClassificationGeneral Classification	CodeCode Available	0	5
PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization	Mar 31, 2025	image-classificationImage Classification	CodeCode Available	0	5
DAP: Detection-Aware Pre-training with Weak Supervision	Mar 30, 2021	ClassificationGeneral Classification	CodeCode Available	0	5
DANet: Divergent Activation for Weakly Supervised Object Localization	Oct 1, 2019	ClassificationGeneral Classification	CodeCode Available	0	5
PEEKABOO: Hiding parts of an image for unsupervised object localization	Jul 24, 2024	Objectobject-detection	CodeCode Available	0	5
Trade-offs in Fine-tuned Diffusion Models Between Accuracy and Interpretability	Mar 31, 2023	Conditional Image GenerationImage Generation	CodeCode Available	0	5
3-Dimensional Sonic Phase-invariant Echo Localization	Jun 14, 2023	Object Localization	CodeCode Available	0	5
Personal Fixations-Based Object Segmentation with Object Localization and Boundary Preservation	Jan 22, 2021	Image SegmentationObject	CodeCode Available	0	5
Count-ception: Counting by Fully Convolutional Redundant Counting	Mar 25, 2017	Object Localizationregression	CodeCode Available	0	5
Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification	Oct 17, 2024	Object LocalizationSketch Recognition	CodeCode Available	0	5
One-Shot General Object Localization	Nov 24, 2022	ObjectObject Localization	CodeCode Available	0	5
Attributional Robustness Training using Input-Gradient Spatial Alignment	Nov 29, 2019	BIG-bench Machine LearningObject Localization	CodeCode Available	0	5
Background-aware Classification Activation Map for Weakly Supervised Object Localization	Dec 29, 2021	ClassificationObject	CodeCode Available	0	5
ALWOD: Active Learning for Weakly-Supervised Object Detection	Sep 14, 2023	Active LearningObject	CodeCode Available	0	5
Convolutional STN for Weakly Supervised Object Localization	Dec 3, 2019	ObjectObject Localization	CodeCode Available	0	5
Object detection via a multi-region & semantic segmentation-aware CNN model	May 7, 2015	Objectobject-detection	CodeCode Available	0	5
Contrastive Corpus Attribution for Explaining Representations	Sep 30, 2022	Contrastive LearningObject Localization	CodeCode Available	0	5
Fast YOLO: A Fast You Only Look Once System for Real-time Embedded Object Detection in Video	Sep 18, 2017	GPUObject	CodeCode Available	0	5
ContextLocNet: Context-Aware Deep Network Models for Weakly Supervised Localization	Sep 14, 2016	ObjectObject Localization	CodeCode Available	0	5
Multispectral Detection Transformer with Infrared-Centric Sensor Fusion	May 21, 2025	Multispectral Object DetectionObject	CodeCode Available	0	5
Object Detection via a Multi-Region and Semantic Segmentation-Aware CNN Model	Dec 1, 2015	Objectobject-detection	CodeCode Available	0	5
Object Detectors Emerge in Deep Scene CNNs	Dec 22, 2014	General ClassificationObject	CodeCode Available	0	5
QUB-PHEO: A Visual-Based Dyadic Multi-View Dataset for Intention Inference in Collaborative Assembly	Sep 23, 2024	Object Localization	CodeCode Available	0	5
Min-Entropy Latent Model for Weakly Supervised Object Detection	Feb 16, 2019	image-classificationImage Classification	CodeCode Available	0	5
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception	May 23, 2024	Object Localization	CodeCode Available	0	5
Concept Visualization: Explaining the CLIP Multi-modal Embedding Using WordNet	May 23, 2024	Object LocalizationOut-of-Distribution Detection	CodeCode Available	0	5
Expeditious Saliency-guided Mix-up through Random Gradient Thresholding	Dec 9, 2022	Classifier calibrationImage Classification	CodeCode Available	0	5
Evaluation of Audio-Visual Alignments in Visually Grounded Speech Models	Jul 5, 2021	Cross-Modal RetrievalObject Localization	CodeCode Available	0	5
All-pairs Consistency Learning for Weakly Supervised Semantic Segmentation	Aug 8, 2023	AllObject Localization	CodeCode Available	0	5
MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing	Mar 31, 2025	Objectobject-detection	CodeCode Available	0	5
Evaluation and Comparison of Visual Language Models for Transportation Engineering Problems	Sep 3, 2024	image-classificationImage Classification	CodeCode Available	0	5

Show:10 25 50

← PrevPage 4 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified