Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 617 papers

Title	Date	Tasks	Status
SilVar: Speech Driven Multimodal Model for Reasoning Visual Question Answering and Object Localization	Dec 21, 2024	Image CaptioningMultimodal Reasoning	CodeCode Available
Demystifying the Potential of ChatGPT-4 Vision for Construction Progress Monitoring	Dec 20, 2024	Object Localization	—Unverified
SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians	Dec 13, 2024	GPUObject Localization	—Unverified
3D Spatial Understanding in MLLMs: Disambiguation and Evaluation	Dec 9, 2024	3D dense captioning3D visual grounding	—Unverified
SeeGround: See and Ground for Zero-Shot Open-Vocabulary 3D Visual Grounding	Dec 5, 2024	3D visual groundingObject Localization	—Unverified
GraPix: Exploring Graph Modularity Optimization for Unsupervised Pixel Clustering	Dec 4, 2024	AttributeClustering	CodeCode Available
RELOCATE: A Simple Training-Free Baseline for Visual Query Localization Using Region-Based Representations	Dec 2, 2024	Object Localization	—Unverified
SpaRC: Sparse Radar-Camera Fusion for 3D Object Detection	Nov 29, 2024	3D Multi-Object Tracking3D Object Detection	CodeCode Available
ObjectRelator: Enabling Cross-View Object Relation Understanding in Ego-Centric and Exo-Centric Videos	Nov 28, 2024	ObjectObject Localization	—Unverified
GloFinder: AI-empowered QuPath Plugin for WSI-level Glomerular Detection, Visualization, and Curation	Nov 27, 2024	Object Localizationwhole slide images	—Unverified
Probing the Mid-level Vision Capabilities of Self-Supervised Learning	Nov 25, 2024	Object LocalizationSelf-Supervised Learning	—Unverified
Time is on my sight: scene graph filtering for dynamic environment perception in an LLM-driven robot	Nov 22, 2024	Object LocalizationTask Planning	—Unverified
FAST-Splat: Fast, Ambiguity-Free Semantics Transfer in Gaussian Splatting	Nov 20, 2024	Dimensionality ReductionGPU	—Unverified
YCB-LUMA: YCB Object Dataset with Luminance Keying for Object Localization	Nov 20, 2024	2D Object DetectionAutonomous Driving	CodeCode Available
Text-guided Zero-Shot Object Localization	Nov 18, 2024	ObjectObject Localization	—Unverified
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning	Nov 15, 2024	DescriptiveObject	—Unverified
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes	Oct 18, 2024	3D geometryobject-detection	—Unverified
Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification	Oct 17, 2024	Object LocalizationSketch Recognition	CodeCode Available
Optimizing Multi-Task Learning for Accurate Spacecraft Pose Estimation	Oct 16, 2024	Multi-Task LearningObject Localization	—Unverified
Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts	Oct 8, 2024	Instance SegmentationObject	—Unverified
DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation	Sep 24, 2024	Contrastive LearningObject Localization	—Unverified
QUB-PHEO: A Visual-Based Dyadic Multi-View Dataset for Intention Inference in Collaborative Assembly	Sep 23, 2024	Object Localization	CodeCode Available
PMR-Net: Parallel Multi-Resolution Encoder-Decoder Network Framework for Medical Image Segmentation	Sep 19, 2024	DecoderImage Segmentation	—Unverified
Do Pre-trained Vision-Language Models Encode Object States?	Sep 16, 2024	Language ModelingLanguage Modelling	CodeCode Available
Top-GAP: Integrating Size Priors in CNNs for more Interpretability, Robustness, and Bias Mitigation	Sep 7, 2024	Object Localization	—Unverified
Prediction Accuracy & Reliability: Classification and Object Localization under Distribution Shift	Sep 5, 2024	Autonomous DrivingBenchmarking	—Unverified
Evaluation and Comparison of Visual Language Models for Transportation Engineering Problems	Sep 3, 2024	image-classificationImage Classification	CodeCode Available
Multi-scale Multi-instance Visual Sound Localization and Segmentation	Aug 31, 2024	Object Localization	—Unverified
Language-guided Scale-aware MedSegmentor for Lesion Segmentation in Medical Imaging	Aug 30, 2024	DiagnosticImage Segmentation	—Unverified
Optimal Weight Scheme for Fusion-Assisted Cooperative Multi-Monostatic Object Localization in 6G Networks	Aug 29, 2024	Object Localization	—Unverified
Multi-Beam Object-Localization for Millimeter-Wave ISAC-Aided Connected Autonomous Vehicles	Aug 26, 2024	Autonomous VehiclesIntegrated sensing and communication	—Unverified
Stimulating Imagination: Towards General-purpose Object Rearrangement	Aug 3, 2024	ObjectObject Localization	—Unverified
Categorical Knowledge Fused Recognition: Fusing Hierarchical Knowledge with Image Classification through Aligning and Deep Metric Learning	Jul 30, 2024	Classificationimage-classification	—Unverified
A Model Generalization Study in Localizing Indoor Cows with COw LOcalization (COLO) dataset	Jul 29, 2024	Data AugmentationObject Localization	—Unverified
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments	Jul 25, 2024	Object Localization	—Unverified
PEEKABOO: Hiding parts of an image for unsupervised object localization	Jul 24, 2024	Objectobject-detection	CodeCode Available
DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy	Jul 24, 2024	Crowd CountingLanguage Modeling	CodeCode Available
Evaluating and Enhancing Trustworthiness of LLMs in Perception Tasks	Jul 18, 2024	Hallucinationobject-detection	—Unverified
Leveraging Transformers for Weakly Supervised Object Localization in Unconstrained Videos	Jul 8, 2024	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available
ALINA: Advanced Line Identification and Notation Algorithm	Jun 13, 2024	Lane LabelingObject Localization	CodeCode Available
FlexLoc: Conditional Neural Networks for Zero-Shot Sensor Perspective Invariance in Object Localization with Distributed Multimodal Sensors	Jun 10, 2024	Object Localization	CodeCode Available
Leveraging Activations for Superpixel Explanations	Jun 7, 2024	Object LocalizationSuperpixels	—Unverified
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception	May 23, 2024	Object Localization	CodeCode Available
Concept Visualization: Explaining the CLIP Multi-modal Embedding Using WordNet	May 23, 2024	Object LocalizationOut-of-Distribution Detection	CodeCode Available
Masked Multi-Query Slot Attention for Unsupervised Object Discovery	Apr 30, 2024	Objectobject-detection	CodeCode Available
Source-Free Domain Adaptation of Weakly-Supervised Object Localization Models for Histology	Apr 29, 2024	Contrastive LearningDomain Adaptation	CodeCode Available
Equivariant Spatio-Temporal Self-Supervision for LiDAR Object Detection	Apr 17, 2024	3D Object DetectionObject	—Unverified
A Realistic Protocol for Evaluation of Weakly Supervised Object Localization	Apr 15, 2024	Model SelectionObject	CodeCode Available
Real-world Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning	Apr 15, 2024	Contrastive LearningDeblurring	—Unverified
Improving Weakly-Supervised Object Localization Using Adversarial Erasing and Pseudo Label	Apr 15, 2024	ObjectObject Localization	—Unverified

Show:10 25 50

← PrevPage 5 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified