Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 617 papers

Title	Date	Tasks	Status	Hype
Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation	Dec 9, 2024	Object LocalizationVision and Language Navigation	CodeCode Available	1
RSUniVLM: A Unified Vision Language Model for Remote Sensing via Granularity-oriented Mixture of Experts	Dec 7, 2024	Change DetectionImage Comprehension	CodeCode Available	1
OCDet: Object Center Detection via Bounding Box-Aware Heatmap Prediction on Edge Devices with NPUs	Nov 23, 2024	Keypoint DetectionObject	CodeCode Available	1
Upsampling DINOv2 features for unsupervised vision tasks and weakly supervised materials segmentation	Oct 20, 2024	Clusteringgraph partitioning	CodeCode Available	1
PuzzleBoard: A New Camera Calibration Pattern with Position Encoding	Sep 30, 2024	Camera CalibrationCamera Pose Estimation	CodeCode Available	1
MambaEVT: Event Stream based Visual Object Tracking using State Space Model	Aug 20, 2024	MambaObject Localization	CodeCode Available	1
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection	Jul 12, 2024	Collaborative InferenceLanguage Modelling	CodeCode Available	1
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis	May 28, 2024	Object Localization	CodeCode Available	1
FlightScope: An Experimental Comparative Review of Aircraft Detection Algorithms in Satellite Imagery	Apr 3, 2024	Objectobject-detection	CodeCode Available	1
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models	Mar 23, 2024	Common Sense ReasoningIn-Context Learning	CodeCode Available	1
Few-shot Object Localization	Mar 19, 2024	Model OptimizationObject	CodeCode Available	1
CAM Back Again: Large Kernel CNNs from a Weakly Supervised Object Localization Perspective	Mar 11, 2024	Data AugmentationObject Localization	CodeCode Available	1
Spatial Structure Constraints for Weakly Supervised Semantic Segmentation	Jan 20, 2024	ObjectObject Localization	CodeCode Available	1
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation	Dec 21, 2023	Edge DetectionFeature Engineering	CodeCode Available	1
Object-Aware Domain Generalization for Object Detection	Dec 19, 2023	Autonomous DrivingContrastive Learning	CodeCode Available	1
Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance	Dec 17, 2023	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	CodeCode Available	1
Exploring Foveation and Saccade for Improved Weakly-Supervised Localization	Dec 16, 2023	Active Object LocalizationFoveation	CodeCode Available	1
Mono3DVG: 3D Visual Grounding in Monocular Images	Dec 13, 2023	3D Object Detection3D visual grounding	CodeCode Available	1
Boosting Segment Anything Model Towards Open-Vocabulary Learning	Dec 6, 2023	modelObject	CodeCode Available	1
BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection	Dec 4, 2023	3D Object DetectionDecoder	CodeCode Available	1
Grounding Everything: Emerging Localization Properties in Vision-Language Transformers	Dec 1, 2023	Image RetrievalObject Localization	CodeCode Available	1
Language Embedded 3D Gaussians for Open-Vocabulary Scene Understanding	Nov 30, 2023	GPUInductive Bias	CodeCode Available	1
Point, Segment and Count: A Generalized Framework for Object Counting	Nov 21, 2023	Knowledge DistillationObject	CodeCode Available	1
Unsupervised Object Localization in the Era of Self-Supervised ViTs: A Survey	Oct 19, 2023	ObjectObject Localization	CodeCode Available	1
Context-Aware Entity Grounding with Open-Vocabulary 3D Scene Graphs	Sep 27, 2023	FormNavigate	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 25Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified