Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 617 papers

Title	Date	Tasks	Status	Hype
Multi-Beam Object-Localization for Millimeter-Wave ISAC-Aided Connected Autonomous Vehicles	Aug 26, 2024	Autonomous VehiclesIntegrated sensing and communication	—Unverified	0
MambaEVT: Event Stream based Visual Object Tracking using State Space Model	Aug 20, 2024	MambaObject Localization	CodeCode Available	1
Stimulating Imagination: Towards General-purpose Object Rearrangement	Aug 3, 2024	ObjectObject Localization	—Unverified	0
Categorical Knowledge Fused Recognition: Fusing Hierarchical Knowledge with Image Classification through Aligning and Deep Metric Learning	Jul 30, 2024	Classificationimage-classification	—Unverified	0
A Model Generalization Study in Localizing Indoor Cows with COw LOcalization (COLO) dataset	Jul 29, 2024	Data AugmentationObject Localization	—Unverified	0
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments	Jul 25, 2024	Object Localization	—Unverified	0
PEEKABOO: Hiding parts of an image for unsupervised object localization	Jul 24, 2024	Objectobject-detection	CodeCode Available	0
DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy	Jul 24, 2024	Crowd CountingLanguage Modeling	CodeCode Available	0
Evaluating and Enhancing Trustworthiness of LLMs in Perception Tasks	Jul 18, 2024	Hallucinationobject-detection	—Unverified	0
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection	Jul 12, 2024	Collaborative InferenceLanguage Modelling	CodeCode Available	1
Leveraging Transformers for Weakly Supervised Object Localization in Unconstrained Videos	Jul 8, 2024	Object LocalizationWeakly-Supervised Object Localization	CodeCode Available	0
ALINA: Advanced Line Identification and Notation Algorithm	Jun 13, 2024	Lane LabelingObject Localization	CodeCode Available	0
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks	Jun 12, 2024	Image GenerationLanguage Modeling	CodeCode Available	5
FlexLoc: Conditional Neural Networks for Zero-Shot Sensor Perspective Invariance in Object Localization with Distributed Multimodal Sensors	Jun 10, 2024	Object Localization	CodeCode Available	0
Leveraging Activations for Superpixel Explanations	Jun 7, 2024	Object LocalizationSuperpixels	—Unverified	0
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis	May 28, 2024	Object Localization	CodeCode Available	1
Concept Visualization: Explaining the CLIP Multi-modal Embedding Using WordNet	May 23, 2024	Object LocalizationOut-of-Distribution Detection	CodeCode Available	0
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception	May 23, 2024	Object Localization	CodeCode Available	0
Many-Shot In-Context Learning in Multimodal Foundation Models	May 16, 2024	image-classificationImage Classification	CodeCode Available	2
Masked Multi-Query Slot Attention for Unsupervised Object Discovery	Apr 30, 2024	Objectobject-detection	CodeCode Available	0
Source-Free Domain Adaptation of Weakly-Supervised Object Localization Models for Histology	Apr 29, 2024	Contrastive LearningDomain Adaptation	CodeCode Available	0
Mamba-FETrack: Frame-Event Tracking via State Space Model	Apr 28, 2024	GPUMamba	CodeCode Available	4
Equivariant Spatio-Temporal Self-Supervision for LiDAR Object Detection	Apr 17, 2024	3D Object DetectionObject	—Unverified	0
A Realistic Protocol for Evaluation of Weakly Supervised Object Localization	Apr 15, 2024	Model SelectionObject	CodeCode Available	0
Real-world Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning	Apr 15, 2024	Contrastive LearningDeblurring	—Unverified	0

Show:10 25 50

← PrevPage 4 of 25Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified