Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 617 papers

Title	Date	Tasks	Status	Hype
Probing the Mid-level Vision Capabilities of Self-Supervised Learning	Nov 25, 2024	Object LocalizationSelf-Supervised Learning	—Unverified	0
OCDet: Object Center Detection via Bounding Box-Aware Heatmap Prediction on Edge Devices with NPUs	Nov 23, 2024	Keypoint DetectionObject	CodeCode Available	1
Time is on my sight: scene graph filtering for dynamic environment perception in an LLM-driven robot	Nov 22, 2024	Object LocalizationTask Planning	—Unverified	0
FAST-Splat: Fast, Ambiguity-Free Semantics Transfer in Gaussian Splatting	Nov 20, 2024	Dimensionality ReductionGPU	—Unverified	0
YCB-LUMA: YCB Object Dataset with Luminance Keying for Object Localization	Nov 20, 2024	2D Object DetectionAutonomous Driving	CodeCode Available	0
Text-guided Zero-Shot Object Localization	Nov 18, 2024	ObjectObject Localization	—Unverified	0
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning	Nov 15, 2024	DescriptiveObject	—Unverified	0
DynaMem: Online Dynamic Spatio-Semantic Memory for Open World Mobile Manipulation	Nov 7, 2024	Object Localization	CodeCode Available	3
Upsampling DINOv2 features for unsupervised vision tasks and weakly supervised materials segmentation	Oct 20, 2024	Clusteringgraph partitioning	CodeCode Available	1
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes	Oct 18, 2024	3D geometryobject-detection	—Unverified	0
Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification	Oct 17, 2024	Object LocalizationSketch Recognition	CodeCode Available	0
Optimizing Multi-Task Learning for Accurate Spacecraft Pose Estimation	Oct 16, 2024	Multi-Task LearningObject Localization	—Unverified	0
Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts	Oct 8, 2024	Instance SegmentationObject	—Unverified	0
PuzzleBoard: A New Camera Calibration Pattern with Position Encoding	Sep 30, 2024	Camera CalibrationCamera Pose Estimation	CodeCode Available	1
A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation	Sep 27, 2024	Exemplar-Free CountingFew-shot Object Counting and Detection	CodeCode Available	2
DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation	Sep 24, 2024	Contrastive LearningObject Localization	—Unverified	0
QUB-PHEO: A Visual-Based Dyadic Multi-View Dataset for Intention Inference in Collaborative Assembly	Sep 23, 2024	Object Localization	CodeCode Available	0
PMR-Net: Parallel Multi-Resolution Encoder-Decoder Network Framework for Medical Image Segmentation	Sep 19, 2024	DecoderImage Segmentation	—Unverified	0
Do Pre-trained Vision-Language Models Encode Object States?	Sep 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Top-GAP: Integrating Size Priors in CNNs for more Interpretability, Robustness, and Bias Mitigation	Sep 7, 2024	Object Localization	—Unverified	0
Prediction Accuracy & Reliability: Classification and Object Localization under Distribution Shift	Sep 5, 2024	Autonomous DrivingBenchmarking	—Unverified	0
Evaluation and Comparison of Visual Language Models for Transportation Engineering Problems	Sep 3, 2024	image-classificationImage Classification	CodeCode Available	0
Multi-scale Multi-instance Visual Sound Localization and Segmentation	Aug 31, 2024	Object Localization	—Unverified	0
Language-guided Scale-aware MedSegmentor for Lesion Segmentation in Medical Imaging	Aug 30, 2024	DiagnosticImage Segmentation	—Unverified	0
Optimal Weight Scheme for Fusion-Assisted Cooperative Multi-Monostatic Object Localization in 6G Networks	Aug 29, 2024	Object Localization	—Unverified	0
Multi-Beam Object-Localization for Millimeter-Wave ISAC-Aided Connected Autonomous Vehicles	Aug 26, 2024	Autonomous VehiclesIntegrated sensing and communication	—Unverified	0
MambaEVT: Event Stream based Visual Object Tracking using State Space Model	Aug 20, 2024	MambaObject Localization	CodeCode Available	1
Stimulating Imagination: Towards General-purpose Object Rearrangement	Aug 3, 2024	ObjectObject Localization	—Unverified	0
Categorical Knowledge Fused Recognition: Fusing Hierarchical Knowledge with Image Classification through Aligning and Deep Metric Learning	Jul 30, 2024	Classificationimage-classification	—Unverified	0
A Model Generalization Study in Localizing Indoor Cows with COw LOcalization (COLO) dataset	Jul 29, 2024	Data AugmentationObject Localization	—Unverified	0
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments	Jul 25, 2024	Object Localization	—Unverified	0
PEEKABOO: Hiding parts of an image for unsupervised object localization	Jul 24, 2024	Objectobject-detection	CodeCode Available	0
DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy	Jul 24, 2024	Crowd CountingLanguage Modeling	CodeCode Available	0
Evaluating and Enhancing Trustworthiness of LLMs in Perception Tasks	Jul 18, 2024	Hallucinationobject-detection	—Unverified	0
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection	Jul 12, 2024	Collaborative InferenceLanguage Modelling	CodeCode Available	1
Leveraging Transformers for Weakly Supervised Object Localization in Unconstrained Videos	Jul 8, 2024	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	0
ALINA: Advanced Line Identification and Notation Algorithm	Jun 13, 2024	Lane LabelingObject Localization	CodeCode Available	0
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks	Jun 12, 2024	Image GenerationLanguage Modeling	CodeCode Available	5
FlexLoc: Conditional Neural Networks for Zero-Shot Sensor Perspective Invariance in Object Localization with Distributed Multimodal Sensors	Jun 10, 2024	Object Localization	CodeCode Available	0
Leveraging Activations for Superpixel Explanations	Jun 7, 2024	Object LocalizationSuperpixels	—Unverified	0
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis	May 28, 2024	Object Localization	CodeCode Available	1
Concept Visualization: Explaining the CLIP Multi-modal Embedding Using WordNet	May 23, 2024	Object LocalizationOut-of-Distribution Detection	CodeCode Available	0
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception	May 23, 2024	Object Localization	CodeCode Available	0
Many-Shot In-Context Learning in Multimodal Foundation Models	May 16, 2024	image-classificationImage Classification	CodeCode Available	2
Masked Multi-Query Slot Attention for Unsupervised Object Discovery	Apr 30, 2024	Objectobject-detection	CodeCode Available	0
Source-Free Domain Adaptation of Weakly-Supervised Object Localization Models for Histology	Apr 29, 2024	Contrastive LearningDomain Adaptation	CodeCode Available	0
Mamba-FETrack: Frame-Event Tracking via State Space Model	Apr 28, 2024	GPUMamba	CodeCode Available	4
Equivariant Spatio-Temporal Self-Supervision for LiDAR Object Detection	Apr 17, 2024	3D Object DetectionObject	—Unverified	0
A Realistic Protocol for Evaluation of Weakly Supervised Object Localization	Apr 15, 2024	Model SelectionObject	CodeCode Available	0
Real-world Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning	Apr 15, 2024	Contrastive LearningDeblurring	—Unverified	0

Show:10 25 50

← PrevPage 2 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified