Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 617 papers

Title	Date	Tasks	Status
IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic	Apr 12, 2024	ObjectObject Localization	CodeCode Available
O2V-Mapping: Online Open-Vocabulary Mapping with Neural Implicit Representation	Apr 10, 2024	Image SegmentationObject	—Unverified
MOSE: Boosting Vision-based Roadside 3D Object Detection with Scene Cues	Apr 8, 2024	3D Object DetectionAutonomous Driving	—Unverified
Towards Two-Stream Foveation-based Active Vision Learning	Mar 24, 2024	FoveationObject	—Unverified
Spatio-Temporal Bi-directional Cross-frame Memory for Distractor Filtering Point Cloud Single Object Tracking	Mar 23, 2024	3D Single Object TrackingAutonomous Driving	—Unverified
Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection	Mar 22, 2024	3D Object Detectionobject-detection	—Unverified
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting	Mar 22, 2024	Instance SegmentationObject Localization	—Unverified
EcoSense: Energy-Efficient Intelligent Sensing for In-Shore Ship Detection through Edge-Cloud Collaboration	Mar 20, 2024	ClassificationObject	—Unverified
Could We Generate Cytology Images from Histopathology Images? An Empirical Study	Mar 16, 2024	Data AugmentationImage-to-Image Translation	—Unverified
Weakly Supervised Monocular 3D Detection with a Single-View Image	Feb 29, 2024	Knowledge DistillationObject Localization	—Unverified
Foveated Retinotopy Improves Classification and Localization in CNNs	Feb 23, 2024	ClassificationImage Categorization	—Unverified
Toward Accurate Camera-based 3D Object Detection via Cascade Depth Estimation and Calibration	Feb 7, 2024	3D Object DetectionDenoising	—Unverified
Good at captioning, bad at counting: Benchmarking GPT-4V on Earth observation data	Jan 31, 2024	BenchmarkingChange Detection	CodeCode Available
CPR++: Object Localization via Single Coarse Point Supervision	Jan 30, 2024	ObjectObject Localization	CodeCode Available
MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection	Jan 22, 2024	3D Object DetectionObject	—Unverified
Domain Adaptation for Large-Vocabulary Object Detectors	Jan 13, 2024	Domain AdaptationKnowledge Graphs	—Unverified
GTA: Guided Transfer of Spatial Attention from Object-Centric Representations	Jan 5, 2024	Inductive BiasObject Localization	—Unverified
Cyclic Learning for Binaural Audio Generation and Localization	Jan 1, 2024	Audio GenerationObject	—Unverified
FRED: Towards a Full Rotation-Equivariance in Aerial Image Object Detection	Dec 22, 2023	Data AugmentationObject	—Unverified
Weakly Supervised Open-Vocabulary Object Detection	Dec 19, 2023	AttributeNovel Concepts	—Unverified
Multiscale Vision Transformer With Deep Clustering-Guided Refinement for Weakly Supervised Object Localization	Dec 15, 2023	ClusteringDeep Clustering	—Unverified
ZeroReg: Zero-Shot Point Cloud Registration with Foundation Models	Dec 5, 2023	DecoderGraph Matching	—Unverified
SANeRF-HQ: Segment Anything for NeRF in High Quality	Dec 3, 2023	NeRFNovel View Synthesis	—Unverified
Union-over-Intersections: Object Detection beyond Winner-Takes-All	Nov 30, 2023	AllInstance Segmentation	CodeCode Available
Seeing Beyond Cancer: Multi-Institutional Validation of Object Localization and 3D Semantic Segmentation using Deep Learning for Breast MRI	Nov 27, 2023	3D Semantic Segmentationobject-detection	—Unverified
Cooperative Multi-Monostatic Sensing for Object Localization in 6G Networks	Nov 24, 2023	Object Localization	—Unverified
DSD-DA: Distillation-based Source Debiasing for Domain Adaptive Object Detection	Nov 17, 2023	Classificationobject-detection	—Unverified
Towards Learning Monocular 3D Object Localization From 2D Labels using the Physical Laws of Motion	Oct 26, 2023	Monocular 3D Object LocalizationObject	CodeCode Available
Object Pose Estimation Annotation Pipeline for Multi-view Monocular Camera Systems in Industrial Settings	Oct 23, 2023	ObjectObject Localization	—Unverified
CLIP meets Model Zoo Experts: Pseudo-Supervision for Visual Enhancement	Oct 21, 2023	Depth Estimationimage-classification	—Unverified
DiPS: Discriminative Pseudo-Label Sampling with Self-Supervised Transformers for Weakly Supervised Object Localization	Oct 9, 2023	ObjectObject Localization	CodeCode Available
Memory-efficient particle filter recurrent neural network for object localization	Oct 2, 2023	Object Localization	—Unverified
Learning to Terminate in Object Navigation	Sep 28, 2023	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
DeepAdaIn-Net: Deep Adaptive Device-Edge Collaborative Inference for Augmented Reality	Sep 22, 2023	Collaborative InferenceFeature Compression	—Unverified
SEMPART: Self-supervised Multi-resolution Partitioning of Image Semantics	Sep 20, 2023	Objectobject-detection	—Unverified
ALWOD: Active Learning for Weakly-Supervised Object Detection	Sep 14, 2023	Active LearningObject	CodeCode Available
HiLM-D: Towards High-Resolution Understanding in Multimodal Large Language Models for Autonomous Driving	Sep 11, 2023	Autonomous DrivingObject Localization	—Unverified
Unsupervised Object Localization with Representer Point Selection	Sep 8, 2023	ObjectObject Localization	CodeCode Available
Four Ways to Improve Verbo-visual Fusion for Dense 3D Visual Grounding	Sep 8, 2023	3D Instance Segmentation3D visual grounding	—Unverified
BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale Weakly Supervised Applications	Sep 7, 2023	Object LocalizationSemantic Segmentation	CodeCode Available
Semantic-Constraint Matching Transformer for Weakly Supervised Object Localization	Sep 4, 2023	ObjectObject Localization	—Unverified
I3DOD: Towards Incremental 3D Object Detection via Prompting	Aug 24, 2023	3D Object DetectionAutonomous Driving	—Unverified
Video OWL-ViT: Temporally-consistent open-world localization in video	Aug 22, 2023	DecoderObject	—Unverified
Towards Grounded Visual Spatial Reasoning in Multi-Modal Vision Language Models	Aug 18, 2023	Image-text matchingObject Localization	—Unverified
Leveraging Next-Active Objects for Context-Aware Anticipation in Egocentric Videos	Aug 16, 2023	Action AnticipationActive Object Localization	—Unverified
Rethinking the Localization in Weakly Supervised Object Localization	Aug 11, 2023	ObjectObject Localization	—Unverified
Rapid Training Data Creation by Synthesizing Medical Images for Classification and Localization	Aug 9, 2023	Medical Image AnalysisObject Localization	—Unverified
All-pairs Consistency Learning for Weakly Supervised Semantic Segmentation	Aug 8, 2023	AllObject Localization	CodeCode Available
A Memory-Augmented Multi-Task Collaborative Framework for Unsupervised Traffic Accident Detection in Driving Videos	Jul 27, 2023	Autonomous DrivingObject	—Unverified
MPDIoU: A Loss for Efficient and Accurate Bounding Box Regression	Jul 14, 2023	Instance SegmentationObject	—Unverified

Show:10 25 50

← PrevPage 6 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified