Object Localization

Object Localization is the task of locating an instance of a particular object category in an image, typically by specifying a tightly cropped bounding box centered on the instance. An object proposal specifies a candidate bounding box, and an object proposal is said to be a correct localization if it sufficiently overlaps a human-labeled “ground-truth” bounding box for the given object. In the literature, the “Object Localization” task is to locate one instance of an object category, whereas “object detection” focuses on locating all instances of a category in a given image.

Source: Fast On-Line Kernel Density Estimation for Active Object Localization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 617 papers

Title	Date	Tasks	Status	Hype
Object Pose Estimation Annotation Pipeline for Multi-view Monocular Camera Systems in Industrial Settings	Oct 23, 2023	ObjectObject Localization	—Unverified	0
CLIP meets Model Zoo Experts: Pseudo-Supervision for Visual Enhancement	Oct 21, 2023	Depth Estimationimage-classification	—Unverified	0
Unsupervised Object Localization in the Era of Self-Supervised ViTs: A Survey	Oct 19, 2023	ObjectObject Localization	CodeCode Available	1
DiPS: Discriminative Pseudo-Label Sampling with Self-Supervised Transformers for Weakly Supervised Object Localization	Oct 9, 2023	ObjectObject Localization	CodeCode Available	0
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection	Oct 4, 2023	3D Object Detectioncross-modal alignment	CodeCode Available	2
Memory-efficient particle filter recurrent neural network for object localization	Oct 2, 2023	Object Localization	—Unverified	0
Learning to Terminate in Object Navigation	Sep 28, 2023	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	0
Context-Aware Entity Grounding with Open-Vocabulary 3D Scene Graphs	Sep 27, 2023	FormNavigate	CodeCode Available	1
CLIP-DIY: CLIP Dense Inference Yields Open-Vocabulary Semantic Segmentation For-Free	Sep 25, 2023	Image SegmentationObject Localization	CodeCode Available	1
DeepAdaIn-Net: Deep Adaptive Device-Edge Collaborative Inference for Augmented Reality	Sep 22, 2023	Collaborative InferenceFeature Compression	—Unverified	0
Background Activation Suppression for Weakly Supervised Object Localization and Semantic Segmentation	Sep 22, 2023	ObjectObject Localization	CodeCode Available	1
SEMPART: Self-supervised Multi-resolution Partitioning of Image Semantics	Sep 20, 2023	Objectobject-detection	—Unverified	0
Unsupervised Open-Vocabulary Object Localization in Videos	Sep 18, 2023	ObjectObject Localization	CodeCode Available	1
FDCNet: Feature Drift Compensation Network for Class-Incremental Weakly Supervised Object Localization	Sep 17, 2023	class-incremental learningIncremental Learning	CodeCode Available	1
ALWOD: Active Learning for Weakly-Supervised Object Detection	Sep 14, 2023	Active LearningObject	CodeCode Available	0
Keep It SimPool: Who Said Supervised Transformers Suffer from Attention Deficit?	Sep 13, 2023	Image ClassificationImage Retrieval	CodeCode Available	1
HiLM-D: Towards High-Resolution Understanding in Multimodal Large Language Models for Autonomous Driving	Sep 11, 2023	Autonomous DrivingObject Localization	—Unverified	0
Four Ways to Improve Verbo-visual Fusion for Dense 3D Visual Grounding	Sep 8, 2023	3D Instance Segmentation3D visual grounding	—Unverified	0
Unsupervised Object Localization with Representer Point Selection	Sep 8, 2023	ObjectObject Localization	CodeCode Available	0
BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale Weakly Supervised Applications	Sep 7, 2023	Object LocalizationSemantic Segmentation	CodeCode Available	0
Context-Aware 3D Object Localization from Single Calibrated Images: A Study of Basketballs	Sep 7, 2023	Autonomous DrivingCamera Calibration	CodeCode Available	1
Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense Captioning	Sep 6, 2023	3D dense captioningCaption Generation	CodeCode Available	1
Semantic-Constraint Matching Transformer for Weakly Supervised Object Localization	Sep 4, 2023	ObjectObject Localization	—Unverified	0
Object-Centric Multiple Object Tracking	Sep 1, 2023	Multiple Object TrackingObject	CodeCode Available	1
Referring Image Segmentation Using Text Supervision	Aug 28, 2023	Image SegmentationObject Localization	CodeCode Available	1
I3DOD: Towards Incremental 3D Object Detection via Prompting	Aug 24, 2023	3D Object DetectionAutonomous Driving	—Unverified	0
Video OWL-ViT: Temporally-consistent open-world localization in video	Aug 22, 2023	DecoderObject	—Unverified	0
Towards Grounded Visual Spatial Reasoning in Multi-Modal Vision Language Models	Aug 18, 2023	Image-text matchingObject Localization	—Unverified	0
Leveraging Next-Active Objects for Context-Aware Anticipation in Egocentric Videos	Aug 16, 2023	Action AnticipationActive Object Localization	—Unverified	0
Rethinking the Localization in Weakly Supervised Object Localization	Aug 11, 2023	ObjectObject Localization	—Unverified	0
Rapid Training Data Creation by Synthesizing Medical Images for Classification and Localization	Aug 9, 2023	Medical Image AnalysisObject Localization	—Unverified	0
All-pairs Consistency Learning for Weakly Supervised Semantic Segmentation	Aug 8, 2023	AllObject Localization	CodeCode Available	0
MCTformer+: Multi-Class Token Transformer for Weakly Supervised Semantic Segmentation	Aug 6, 2023	Object LocalizationSemantic Segmentation	CodeCode Available	1
A Memory-Augmented Multi-Task Collaborative Framework for Unsupervised Traffic Accident Detection in Driving Videos	Jul 27, 2023	Autonomous DrivingObject	—Unverified	0
Optical Flow boosts Unsupervised Localization and Segmentation	Jul 25, 2023	Lifelong learningObject	CodeCode Available	1
Cascade-DETR: Delving into High-Quality Universal Object Detection	Jul 20, 2023	DecoderObject	CodeCode Available	1
Generative Prompt Model for Weakly Supervised Object Localization	Jul 19, 2023	DenoisingImage Denoising	CodeCode Available	1
MPDIoU: A Loss for Efficient and Accurate Bounding Box Regression	Jul 14, 2023	Instance SegmentationObject	—Unverified	0
YOLIC: An Efficient Method for Object Localization and Classification on Edge Devices	Jul 13, 2023	ClassificationComputational Efficiency	CodeCode Available	0
Open-Vocabulary Object Detection via Scene Graph Discovery	Jul 7, 2023	DecoderGraph Generation	—Unverified	0
EgoCOL: Egocentric Camera pose estimation for Open-world 3D object Localization @Ego4D challenge 2023	Jun 29, 2023	Camera Pose EstimationObject	CodeCode Available	0
PanoOcc: Unified Occupancy Representation for Camera-based 3D Panoptic Segmentation	Jun 16, 2023	3D Panoptic SegmentationAutonomous Driving	CodeCode Available	1
3-Dimensional Sonic Phase-invariant Echo Localization	Jun 14, 2023	Object Localization	CodeCode Available	0
A Novel Confidence Induced Class Activation Mapping for MRI Brain Tumor Segmentation	Jun 8, 2023	Brain Tumor SegmentationObject Localization	CodeCode Available	0
NeurOCS: Neural NOCS Supervision for Monocular 3D Object Localization	May 28, 2023	Monocular 3D Object LocalizationObject	—Unverified	0
Counterfactual Co-occurring Learning for Bias Mitigation in Weakly-supervised Object Localization	May 24, 2023	Attributecounterfactual	—Unverified	0
Learning high-level visual representations from a child's perspective without strong inductive biases	May 24, 2023	ObjectObject Localization	CodeCode Available	1
Probing the Role of Positional Information in Vision-Language Models	May 17, 2023	Contrastive LearningImage-text matching	—Unverified	0
AV-SAM: Segment Anything Model Meets Audio-Visual Localization and Segmentation	May 3, 2023	DecoderObject Localization	—Unverified	0
A Systematic Study on Object Recognition Using Millimeter-wave Radar	May 3, 2023	ObjectObject Localization	—Unverified	0

Show:10 25 50

← PrevPage 4 of 13Next →

All datasets REVERIE KITTI Cars Easy KITTI Pedestrians Hard KITTI Pedestrians Moderate KITTI Cars Hard KITTI Cyclists Easy KITTI Cyclists Moderate KITTI Pedestrians Easy GRIT KITTI Cyclists Hard IllusionVQA KITTI Cars Moderate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	OSMaN	RGSPL	32.99	—	Unverified
2	SUSA	RGSPL	27.31	—	Unverified
3	Shanks	RGSPL	22.85	—	Unverified
4	CVPR22	RGSPL	22.06	—	Unverified
5	damm1	RGSPL	15.96	—	Unverified
6	1637	RGSPL	14.03	—	Unverified
7	init. PREVALENT	RGSPL	13.51	—	Unverified
8	Airbert	RGSPL	13.28	—	Unverified
9	init. OSCAR	RGSPL	10	—	Unverified
10	SIA	RGSPL	9.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	89.35	—	Unverified
2	VoxelNet	AP	89.35	—	Unverified
3	Frustum PointNets	AP	88.7	—	Unverified
4	Frustum PointNets	AP	81.2	—	Unverified
5	VoxelNet	AP	77.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	48.3	—	Unverified
2	Frustum PointNets	AP	47.2	—	Unverified
3	Frustum PointNets	AP	40.23	—	Unverified
4	VoxelNet	AP	38.11	—	Unverified
5	VoxelNet	AP	31.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	52.23	—	Unverified
2	Frustum PointNets	AP	50.22	—	Unverified
3	Frustum PointNets	AP	42.15	—	Unverified
4	VoxelNet	AP	40.74	—	Unverified
5	VoxelNet	AP	33.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VoxelNet	AP	77.39	—	Unverified
2	Frustum PointNets	AP	75.33	—	Unverified
3	Frustum PointNets	AP	62.19	—	Unverified
4	VoxelNet	AP	57.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	75.38	—	Unverified
2	Frustum PointNets	AP	71.96	—	Unverified
3	VoxelNet	AP	66.7	—	Unverified
4	VoxelNet	AP	61.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	61.96	—	Unverified
2	Frustum PointNets	AP	56.77	—	Unverified
3	VoxelNet	AP	54.76	—	Unverified
4	VoxelNet	AP	48.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	58.09	—	Unverified
2	Frustum PointNets	AP	51.21	—	Unverified
3	VoxelNet	AP	46.13	—	Unverified
4	VoxelNet	AP	39.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unified-IOXL	Localization (ablation)	67	—	Unverified
2	GPV-2	Localization (ablation)	53.6	—	Unverified
3	Mask R-CNN	Localization (ablation)	44.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	54.68	—	Unverified
2	VoxelNe	AP	50.55	—	Unverified
3	Frustum PointNets	AP	50.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT4-Vision 4-shot+CoT	Accuracy	49.7	—	Unverified
2	Gemini-Pro 4-shot+CoT	Accuracy	33.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustum PointNets	AP	84	—	Unverified
2	VoxelNet	AP	79.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Frustrum-PointPillars	AP	60.98	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Precision	88.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	41.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ours	CorLoc	47.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	F-Score	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Hausdorff Loss	Recall	89.2	—	Unverified