Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 617 papers

Title	Date	Tasks	Status	Hype
UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling	Nov 23, 2021	Image CaptioningImage Description	CodeCode Available	1
BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection	Dec 4, 2023	3D Object DetectionDecoder	CodeCode Available	1
Beyond Greedy Search: Tracking by Multi-Agent Reinforcement Learning-based Beam Search	May 19, 2022	Decision MakingImage Captioning	CodeCode Available	1
Learning to Augment Synthetic Images for Sim2Real Policy Transfer	Mar 18, 2019	Object Localization	CodeCode Available	1
Frustum PointNets for 3D Object Detection from RGB-D Data	Nov 22, 2017	3D Object DetectionObject	CodeCode Available	1
Few-Shot Object Detection via Variational Feature Aggregation	Jan 31, 2023	Few-Shot Object DetectionMeta-Learning	CodeCode Available	1
DAFNe: A One-Stage Anchor-Free Approach for Oriented Object Detection	Sep 13, 2021	object-detectionObject Detection	CodeCode Available	1
Mask R-CNN	Mar 20, 2017	3D Instance SegmentationHuman Part Segmentation	CodeCode Available	1
Boosting Segment Anything Model Towards Open-Vocabulary Learning	Dec 6, 2023	modelObject	CodeCode Available	1
Boosting Weakly Supervised Object Detection via Learning Bounding Box Adjusters	Aug 3, 2021	Objectobject-detection	CodeCode Available	1
Anchor-free Small-scale Multispectral Pedestrian Detection	Aug 19, 2020	Autonomous DrivingData Augmentation	CodeCode Available	1
Few-shot Object Localization	Mar 19, 2024	Model OptimizationObject	CodeCode Available	1
Frustum-PointPillars: A Multi-Stage Approach for 3D Object Detection using RGB Camera and LiDAR	Oct 11, 2021	2D Object Detection3D Object Detection	CodeCode Available	1
Keep CALM and Improve Visual Feature Attribution	Jun 15, 2021	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
Exploring Foveation and Saccade for Improved Weakly-Supervised Localization	Dec 16, 2023	Active Object LocalizationFoveation	CodeCode Available	1
Evaluating Weakly Supervised Object Localization Methods Right	Jan 21, 2020	Few-Shot LearningModel Selection	CodeCode Available	1
Extending Large Vision-Language Model for Diverse Interactive Tasks in Autonomous Driving	May 13, 2025	3D visual groundingAutonomous Driving	CodeCode Available	1
Efficient Object Localization Using Convolutional Networks	Nov 16, 2014	ObjectObject Localization	CodeCode Available	1
CAM Back Again: Large Kernel CNNs from a Weakly Supervised Object Localization Perspective	Mar 11, 2024	Data AugmentationObject Localization	CodeCode Available	1
Egocentric Audio-Visual Object Localization	Mar 23, 2023	ObjectObject Localization	CodeCode Available	1
Faraway-Frustum: Dealing with Lidar Sparsity for 3D Object Detection using Fusion	Nov 3, 2020	3D Object DetectionObject	CodeCode Available	1
Distilling Knowledge from Refinement in Multiple Instance Detection Networks	Apr 23, 2020	Knowledge DistillationMultiple Instance Learning	CodeCode Available	1
Cascade-DETR: Delving into High-Quality Universal Object Detection	Jul 20, 2023	DecoderObject	CodeCode Available	1
EDN: Salient Object Detection via Extremely-Downsampled Network	Dec 24, 2020	DecoderObject	CodeCode Available	1
A Generic Visualization Approach for Convolutional Neural Networks	Jul 19, 2020	ClassificationGeneral Classification	CodeCode Available	1
Eigen-CAM: Class Activation Map using Principal Components	Aug 1, 2020	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
Evaluation for Weakly Supervised Object Localization: Protocol, Metrics, and Datasets	Jul 8, 2020	Few-Shot LearningModel Selection	CodeCode Available	1
CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud	Dec 5, 2020	3D Object DetectionBirds Eye View Object Detection	CodeCode Available	1
Class-aware Sounding Objects Localization via Audiovisual Correspondence	Dec 22, 2021	Objectobject-detection	CodeCode Available	1
Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation	Dec 9, 2024	Object LocalizationVision and Language Navigation	CodeCode Available	1
CLIP-DIY: CLIP Dense Inference Yields Open-Vocabulary Semantic Segmentation For-Free	Sep 25, 2023	Image SegmentationObject Localization	CodeCode Available	1
FDCNet: Feature Drift Compensation Network for Class-Incremental Weakly Supervised Object Localization	Sep 17, 2023	class-incremental learningIncremental Learning	CodeCode Available	1
CoWs on Pasture: Baselines and Benchmarks for Language-Driven Zero-Shot Object Navigation	Mar 20, 2022	image-classificationImage Classification	CodeCode Available	1
CLIP the Gap: A Single Domain Generalization Approach for Object Detection	Jan 13, 2023	Domain Generalizationimage-classification	CodeCode Available	1
Audio-Visual Grouping Network for Sound Localization from Mixtures	Mar 29, 2023	Object LocalizationSound Source Localization	CodeCode Available	1
Dual-attention Guided Dropblock Module for Weakly Supervised Object Localization	Mar 9, 2020	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
Building Calibrated Deep Models via Uncertainty Matching with Auxiliary Interval Predictors	Sep 9, 2019	Object LocalizationPrediction	CodeCode Available	1
Generative Prompt Model for Weakly Supervised Object Localization	Jul 19, 2023	DenoisingImage Denoising	CodeCode Available	1
Cross-Modal Weighting Network for RGB-D Salient Object Detection	Jul 9, 2020	object-detectionObject Detection	CodeCode Available	1
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection	Jul 12, 2024	Collaborative InferenceLanguage Modelling	CodeCode Available	1
CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features	May 13, 2019	Domain GeneralizationImage Captioning	CodeCode Available	1
Grounding Everything: Emerging Localization Properties in Vision-Language Transformers	Dec 1, 2023	Image RetrievalObject Localization	CodeCode Available	1
HINT: Hierarchical Neuron Concept Explainer	Mar 27, 2022	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	1
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models	Mar 23, 2024	Common Sense ReasoningIn-Context Learning	CodeCode Available	1
CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching	Mar 23, 2023	Described Object Detectionobject-detection	CodeCode Available	1
Context-Aware Entity Grounding with Open-Vocabulary 3D Scene Graphs	Sep 27, 2023	FormNavigate	CodeCode Available	1
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation	Dec 21, 2023	Edge DetectionFeature Engineering	CodeCode Available	1
DeepCut: Unsupervised Segmentation using Graph Neural Networks Clustering	Dec 12, 2022	ClusteringGraph Neural Network	CodeCode Available	1
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis	May 28, 2024	Object Localization	CodeCode Available	1
DETReg: Unsupervised Pretraining with Region Priors for Object Detection	Jun 8, 2021	Few-Shot LearningFew-Shot Object Detection	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified