Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 617 papers

Title	Date	Tasks	Status	Hype
Improving Weakly-Supervised Object Localization Using Adversarial Erasing and Pseudo Label	Apr 15, 2024	ObjectObject Localization	—Unverified	0
IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic	Apr 12, 2024	ObjectObject Localization	CodeCode Available	0
O2V-Mapping: Online Open-Vocabulary Mapping with Neural Implicit Representation	Apr 10, 2024	Image SegmentationObject	—Unverified	0
MOSE: Boosting Vision-based Roadside 3D Object Detection with Scene Cues	Apr 8, 2024	3D Object DetectionAutonomous Driving	—Unverified	0
FlightScope: An Experimental Comparative Review of Aircraft Detection Algorithms in Satellite Imagery	Apr 3, 2024	Objectobject-detection	CodeCode Available	1
Towards Two-Stream Foveation-based Active Vision Learning	Mar 24, 2024	FoveationObject	—Unverified	0
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models	Mar 23, 2024	Common Sense ReasoningIn-Context Learning	CodeCode Available	1
Spatio-Temporal Bi-directional Cross-frame Memory for Distractor Filtering Point Cloud Single Object Tracking	Mar 23, 2024	3D Single Object TrackingAutonomous Driving	—Unverified	0
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting	Mar 22, 2024	Instance SegmentationObject Localization	—Unverified	0
Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection	Mar 22, 2024	3D Object Detectionobject-detection	—Unverified	0
EcoSense: Energy-Efficient Intelligent Sensing for In-Shore Ship Detection through Edge-Cloud Collaboration	Mar 20, 2024	ClassificationObject	—Unverified	0
Few-shot Object Localization	Mar 19, 2024	Model OptimizationObject	CodeCode Available	1
Could We Generate Cytology Images from Histopathology Images? An Empirical Study	Mar 16, 2024	Data AugmentationImage-to-Image Translation	—Unverified	0
CAM Back Again: Large Kernel CNNs from a Weakly Supervised Object Localization Perspective	Mar 11, 2024	Data AugmentationObject Localization	CodeCode Available	1
The All-Seeing Project V2: Towards General Relation Comprehension of the Open World	Feb 29, 2024	AllHallucination	CodeCode Available	4
Weakly Supervised Monocular 3D Detection with a Single-View Image	Feb 29, 2024	Knowledge DistillationObject Localization	—Unverified	0
Foveated Retinotopy Improves Classification and Localization in CNNs	Feb 23, 2024	ClassificationImage Categorization	—Unverified	0
Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models	Feb 12, 2024	HallucinationObject Localization	CodeCode Available	4
Toward Accurate Camera-based 3D Object Detection via Cascade Depth Estimation and Calibration	Feb 7, 2024	3D Object DetectionDenoising	—Unverified	0
Good at captioning, bad at counting: Benchmarking GPT-4V on Earth observation data	Jan 31, 2024	BenchmarkingChange Detection	CodeCode Available	0
CPR++: Object Localization via Single Coarse Point Supervision	Jan 30, 2024	ObjectObject Localization	—Unverified	0
MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection	Jan 22, 2024	3D Object DetectionObject	—Unverified	0
Spatial Structure Constraints for Weakly Supervised Semantic Segmentation	Jan 20, 2024	ObjectObject Localization	CodeCode Available	1
Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection	Jan 19, 2024	Multispectral Object DetectionObject	CodeCode Available	2
Domain Adaptation for Large-Vocabulary Object Detectors	Jan 13, 2024	Domain AdaptationKnowledge Graphs	—Unverified	0
Bilateral Reference for High-Resolution Dichotomous Image Segmentation	Jan 7, 2024	Camouflaged Object SegmentationDichotomous Image Segmentation	CodeCode Available	7
GTA: Guided Transfer of Spatial Attention from Object-Centric Representations	Jan 5, 2024	Inductive BiasObject Localization	—Unverified	0
Point Segment and Count: A Generalized Framework for Object Counting	Jan 1, 2024	Few-shot Object Counting and DetectionKnowledge Distillation	CodeCode Available	2
Cyclic Learning for Binaural Audio Generation and Localization	Jan 1, 2024	Audio GenerationObject	—Unverified	0
LangSplat: 3D Language Gaussian Splatting	Dec 26, 2023	NeRFObject Localization	CodeCode Available	3
FRED: Towards a Full Rotation-Equivariance in Aerial Image Object Detection	Dec 22, 2023	Data AugmentationObject	—Unverified	0
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation	Dec 21, 2023	Edge DetectionFeature Engineering	CodeCode Available	1
Object-Aware Domain Generalization for Object Detection	Dec 19, 2023	Autonomous DrivingContrastive Learning	CodeCode Available	1
Weakly Supervised Open-Vocabulary Object Detection	Dec 19, 2023	AttributeNovel Concepts	—Unverified	0
Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance	Dec 17, 2023	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	CodeCode Available	1
Exploring Foveation and Saccade for Improved Weakly-Supervised Localization	Dec 16, 2023	Active Object LocalizationFoveation	CodeCode Available	1
Multiscale Vision Transformer With Deep Clustering-Guided Refinement for Weakly Supervised Object Localization	Dec 15, 2023	ClusteringDeep Clustering	—Unverified	0
Mono3DVG: 3D Visual Grounding in Monocular Images	Dec 13, 2023	3D Object Detection3D visual grounding	CodeCode Available	1
Boosting Segment Anything Model Towards Open-Vocabulary Learning	Dec 6, 2023	modelObject	CodeCode Available	1
ZeroReg: Zero-Shot Point Cloud Registration with Foundation Models	Dec 5, 2023	DecoderGraph Matching	—Unverified	0
BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection	Dec 4, 2023	3D Object DetectionDecoder	CodeCode Available	1
SANeRF-HQ: Segment Anything for NeRF in High Quality	Dec 3, 2023	NeRFNovel View Synthesis	—Unverified	0
Grounding Everything: Emerging Localization Properties in Vision-Language Transformers	Dec 1, 2023	Image RetrievalObject Localization	CodeCode Available	1
Language Embedded 3D Gaussians for Open-Vocabulary Scene Understanding	Nov 30, 2023	GPUInductive Bias	CodeCode Available	1
Union-over-Intersections: Object Detection beyond Winner-Takes-All	Nov 30, 2023	AllInstance Segmentation	CodeCode Available	0
Seeing Beyond Cancer: Multi-Institutional Validation of Object Localization and 3D Semantic Segmentation using Deep Learning for Breast MRI	Nov 27, 2023	3D Semantic Segmentationobject-detection	—Unverified	0
Cooperative Multi-Monostatic Sensing for Object Localization in 6G Networks	Nov 24, 2023	Object Localization	—Unverified	0
Point, Segment and Count: A Generalized Framework for Object Counting	Nov 21, 2023	Knowledge DistillationObject	CodeCode Available	1
DSD-DA: Distillation-based Source Debiasing for Domain Adaptive Object Detection	Nov 17, 2023	Classificationobject-detection	—Unverified	0
Towards Learning Monocular 3D Object Localization From 2D Labels using the Physical Laws of Motion	Oct 26, 2023	Monocular 3D Object LocalizationObject	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified