Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 617 papers

Title	Date	Tasks	Status
Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification	Oct 17, 2024	Object LocalizationSketch Recognition	CodeCode Available
Does Thermal Really Always Matter for RGB-T Salient Object Detection?	Oct 9, 2022	object-detectionObject Detection	CodeCode Available
Count-ception: Counting by Fully Convolutional Redundant Counting	Mar 25, 2017	Object Localizationregression	CodeCode Available
TeD-Loc: Text Distillation for Weakly Supervised Object Localization	Jan 22, 2025	ClassificationDenoising	CodeCode Available
MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing	Mar 31, 2025	Objectobject-detection	CodeCode Available
Tell Me Where to Look: Guided Attention Inference Network	Feb 27, 2018	Object LocalizationSemantic Segmentation	CodeCode Available
Adversarial Normalization: I Can Visualize Everything (ICE)	Jan 1, 2023	Object DiscoveryObject Localization	CodeCode Available
BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale Weakly Supervised Applications	Sep 7, 2023	Object LocalizationSemantic Segmentation	CodeCode Available
RON: Reverse Connection with Objectness Prior Networks for Object Detection	Jul 6, 2017	GPUObject	CodeCode Available
Understanding the effects of artifacts on automated polyp detection and incorporating that knowledge via learning without forgetting	Feb 7, 2020	Object Localization	CodeCode Available
Good at captioning, bad at counting: Benchmarking GPT-4V on Earth observation data	Jan 31, 2024	BenchmarkingChange Detection	CodeCode Available
Min-Entropy Latent Model for Weakly Supervised Object Detection	Feb 16, 2019	image-classificationImage Classification	CodeCode Available
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition	Mar 31, 2025	Few-Shot LearningFont Recognition	CodeCode Available
GraPix: Exploring Graph Modularity Optimization for Unsupervised Pixel Clustering	Dec 4, 2024	AttributeClustering	CodeCode Available
Weakly-supervised Instance Segmentation via Class-agnostic Learning with Salient Images	Apr 4, 2021	Box-supervised Instance SegmentationInstance Segmentation	CodeCode Available
Grid R-CNN	Nov 29, 2018	2D Object DetectionNovel Object Detection	CodeCode Available
ALWOD: Active Learning for Weakly-Supervised Object Detection	Sep 14, 2023	Active LearningObject	CodeCode Available
Trade-offs in Fine-tuned Diffusion Models Between Accuracy and Interpretability	Mar 31, 2023	Conditional Image GenerationImage Generation	CodeCode Available
Dilated Residual Networks	May 28, 2017	ClassificationGeneral Classification	CodeCode Available
PEEKABOO: Hiding parts of an image for unsupervised object localization	Jul 24, 2024	Objectobject-detection	CodeCode Available
The Earth ain't Flat: Monocular Reconstruction of Vehicles on Steep and Graded Roads from a Moving Camera	Mar 6, 2018	Autonomous DrivingMonocular Reconstruction	CodeCode Available
Video Anomaly Detection by Estimating Likelihood of Representations	Dec 2, 2020	Action RecognitionAnomaly Detection	CodeCode Available
Personal Fixations-Based Object Segmentation with Object Localization and Boundary Preservation	Jan 22, 2021	Image SegmentationObject	CodeCode Available
Sketch-based Video Object Localization	Apr 2, 2023	ObjectObject Localization	CodeCode Available
Hide-and-Seek: A Data Augmentation Technique for Weakly-Supervised Localization and Beyond	Nov 6, 2018	Action LocalizationData Augmentation	CodeCode Available
Hide-and-Seek: Forcing a Network to be Meticulous for Weakly-supervised Object and Action Localization	Apr 13, 2017	Action LocalizationObject	CodeCode Available
MonoGRNet: A Geometric Reasoning Network for Monocular 3D Object Localization	Nov 26, 2018	2D Object Detection3D Object Detection	CodeCode Available
PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization	Mar 31, 2025	image-classificationImage Classification	CodeCode Available
Deep Weakly-Supervised Learning Methods for Classification and Localization in Histology Images: A Survey	Sep 8, 2019	General ClassificationModel Selection	CodeCode Available
Holistic 3D Scene Parsing and Reconstruction from a Single RGB Image	Aug 7, 2018	3D Object DetectionMonocular 3D Object Detection	CodeCode Available
ScanRefer: 3D Object Localization in RGB-D Scans using Natural Language	Dec 18, 2019	ObjectObject Localization	CodeCode Available
Scene-Text Oriented Reffering Expression Comprehension	Nov 4, 2022	Object LocalizationReferring Expression	CodeCode Available
DiPS: Discriminative Pseudo-Label Sampling with Self-Supervised Transformers for Weakly Supervised Object Localization	Oct 9, 2023	ObjectObject Localization	CodeCode Available
Discriminating Known From Unknown Objects via Structure-Enhanced Recurrent Variational AutoEncoder	Jan 1, 2023	Objectobject-detection	CodeCode Available
IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic	Apr 12, 2024	ObjectObject Localization	CodeCode Available
Slack and Margin Rescaling as Convex Extensions of Supermodular Functions	Jun 19, 2016	Image SegmentationObject Localization	CodeCode Available
DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling	Mar 30, 2017	object-detectionObject Detection	CodeCode Available
Adversarial Complementary Learning for Weakly Supervised Object Localization	Apr 19, 2018	General ClassificationObject	CodeCode Available
A Novel Confidence Induced Class Activation Mapping for MRI Brain Tumor Segmentation	Jun 8, 2023	Brain Tumor SegmentationObject Localization	CodeCode Available
Smooth Grad-CAM++: An Enhanced Inference Level Visualization Technique for Deep Convolutional Neural Network Models	Aug 3, 2019	image-classificationImage Classification	CodeCode Available
DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy	Jul 24, 2024	Crowd CountingLanguage Modeling	CodeCode Available
A Simple Single-Scale Vision Transformer for Object Localization and Instance Segmentation	Dec 17, 2021	image-classificationImage Classification	CodeCode Available
Improving Object Localization with Fitness NMS and Bounded IoU Loss	Nov 1, 2017	ClusteringObject Localization	CodeCode Available
A Smoother Way to Train Structured Prediction Models	Feb 8, 2019	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection	Feb 19, 2018	Objectobject-detection	CodeCode Available
DANet: Divergent Activation for Weakly Supervised Object Localization	Oct 1, 2019	ClassificationGeneral Classification	CodeCode Available
Pairwise Similarity Knowledge Transfer for Weakly Supervised Object Localization	Mar 18, 2020	Object LocalizationTransfer Learning	CodeCode Available
DAP: Detection-Aware Pre-training with Weak Supervision	Mar 30, 2021	ClassificationGeneral Classification	CodeCode Available
Multispectral Detection Transformer with Infrared-Centric Sensor Fusion	May 21, 2025	Multispectral Object DetectionObject	CodeCode Available
In-sample Contrastive Learning and Consistent Attention for Weakly Supervised Object Localization	Sep 25, 2020	Contrastive LearningObject	CodeCode Available

Show:10 25 50

← PrevPage 12 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified