Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 2262 papers

Title	Date	Tasks	Status	Hype
SCORE: Scene Context Matters in Open-Vocabulary Remote Sensing Instance Segmentation	Jul 17, 2025	Earth ObservationInstance Segmentation	CodeCode Available	0
Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping	Jul 15, 2025	Instance Segmentationobject-detection	—Unverified	0
SPADE: Spatial-Aware Denoising Network for Open-vocabulary Panoptic Scene Graph Generation with Long- and Local-range Context Reasoning	Jul 8, 2025	DenoisingGraph Generation	—Unverified	0
DreamGrasp: Zero-Shot 3D Multi-Object Reconstruction from Partial-View Images for Robotic Manipulation	Jul 8, 2025	3D geometry3D Reconstruction	—Unverified	0
Beyond Appearance: Geometric Cues for Robust Video Instance Segmentation	Jul 8, 2025	Depth EstimationDepth Prediction	—Unverified	0
No time to train! Training-Free Reference-Based Instance Segmentation	Jul 3, 2025	Cross-Domain Few-Shot Object DetectionFew-Shot Object Detection	CodeCode Available	3
NOCTIS: Novel Object Cyclic Threshold based Instance Segmentation	Jul 2, 2025	Instance SegmentationObject	CodeCode Available	0
VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding	Jun 28, 2025	3DGSInstance Segmentation	—Unverified	0
Leader360V: The Large-scale, Real-world 360 Video Dataset for Multi-task Learning in Diverse Environment	Jun 17, 2025	Autonomous DrivingInstance Segmentation	—Unverified	0
A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects	Jun 16, 2025	BenchmarkingInstance Segmentation	—Unverified	0
Prohibited Items Segmentation via Occlusion-aware Bilayer Modeling	Jun 13, 2025	DecoderImage Segmentation	CodeCode Available	0
ALBERT: Advanced Localization and Bidirectional Encoder Representations from Transformers for Automotive Damage Evaluation	Jun 12, 2025	Instance SegmentationSegmentation	—Unverified	0
The Four Color Theorem for Cell Instance Segmentation	Jun 11, 2025	Computational EfficiencyInstance Segmentation	CodeCode Available	1
Accurate and efficient zero-shot 6D pose estimation with frozen foundation models	Jun 11, 2025	6D Pose EstimationInstance Segmentation	—Unverified	0
SAM2Auto: Auto Annotation Using FLASH	Jun 9, 2025	Instance SegmentationObject	—Unverified	0
OpenSplat3D: Open-Vocabulary 3D Instance Segmentation using Gaussian Splatting	Jun 9, 2025	3DGS3D Instance Segmentation	—Unverified	0
You Only Estimate Once: Unified, One-stage, Real-Time Category-level Articulated Object 6D Pose Estimation for Robotic Grasping	Jun 6, 2025	6D Pose EstimationInstance Segmentation	—Unverified	0
Bringing SAM to new heights: Leveraging elevation data for tree crown segmentation from drone imagery	Jun 5, 2025	Instance SegmentationSemantic Segmentation	—Unverified	0
OpenMaskDINO3D : Reasoning 3D Segmentation via Large Language Model	Jun 5, 2025	Instance SegmentationLanguage Modeling	CodeCode Available	1
CzechLynx: A Dataset for Individual Identification and Pose Estimation of the Eurasian Lynx	Jun 5, 2025	2D Pose EstimationBenchmarking	—Unverified	0
Gen-n-Val: Agentic Image Data Generation and Validation	Jun 5, 2025	Image HarmonizationInstance Segmentation	—Unverified	0
SPPSFormer: High-quality Superpoint-based Transformer for Roof Plane Instance Segmentation from Point Clouds	May 30, 2025	Data AugmentationInstance Segmentation	—Unverified	0
CAST: Contrastive Adaptation and Distillation for Semi-Supervised Instance Segmentation	May 28, 2025	Domain AdaptationInstance Segmentation	—Unverified	0
ConfLUNet: Multiple sclerosis lesion instance segmentation in presence of confluent lesions	May 28, 2025	Instance SegmentationLesion Detection	—Unverified	0
The Missing Point in Vision Transformers for Universal Image Segmentation	May 26, 2025	Image SegmentationInstance Segmentation	CodeCode Available	2
ThinkVideo: High-Quality Reasoning Video Segmentation with Chain of Thoughts	May 24, 2025	Image SegmentationInstance Segmentation	CodeCode Available	0
Detailed Evaluation of Modern Machine Learning Approaches for Optic Plastics Sorting	May 22, 2025	Instance SegmentationObject Recognition	—Unverified	0
Sketchy Bounding-box Supervision for 3D Instance Segmentation	May 22, 2025	3D Instance SegmentationInstance Segmentation	CodeCode Available	1
RE-TRIP : Reflectivity Instance Augmented Triangle Descriptor for 3D Place Recognition	May 22, 2025	3D Place RecognitionInstance Segmentation	CodeCode Available	1
UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset	May 21, 2025	Instance SegmentationKnowledge Distillation	CodeCode Available	1
gen2seg: Generative Models Enable Generalizable Instance Segmentation	May 21, 2025	DecoderInstance Segmentation	—Unverified	0
Decoupling Classifier for Boosting Few-shot Object Detection and Instance Segmentation	May 20, 2025	Few-Shot Object DetectionInstance Segmentation	CodeCode Available	1
Instance Segmentation for Point Sets	May 20, 2025	Instance SegmentationSegmentation	—Unverified	0
Industrial Synthetic Segment Pre-training	May 19, 2025	Instance SegmentationSegmentation	—Unverified	0
FlowCut: Unsupervised Video Instance Segmentation via Temporal Mask Matching	May 19, 2025	Instance SegmentationSegmentation	—Unverified	0
Enhancing Transformers Through Conditioned Embedded Tokens	May 19, 2025	image-classificationImage Classification	—Unverified	0
SoftPQ: Robust Instance Segmentation Evaluation via Soft Matching and Tunable Thresholds	May 17, 2025	BenchmarkingBinary Classification	CodeCode Available	0
SurgPose: Generalisable Surgical Instrument Pose Estimation using Zero-Shot Learning and Stereo Vision	May 16, 2025	Depth EstimationInstance Segmentation	—Unverified	0
Pseudo-Label Quality Decoupling and Correction for Semi-Supervised Instance Segmentation	May 16, 2025	Instance SegmentationPseudo Label	—Unverified	0
The RaspGrade Dataset: Towards Automatic Raspberry Ripeness Grading with Deep Learning	May 13, 2025	Instance SegmentationSemantic Segmentation	—Unverified	0
Vision Foundation Model Embedding-Based Semantic Anomaly Detection	May 12, 2025	Anomaly DetectionAnomaly Localization	—Unverified	0
Mix-QSAM: Mixed-Precision Quantization of the Segment Anything Model	May 8, 2025	Computational EfficiencyInstance Segmentation	—Unverified	0
RepSNet: A Nucleus Instance Segmentation model based on Boundary Regression and Structural Re-parameterization	May 8, 2025	Computational EfficiencyInstance Segmentation	—Unverified	0
Hyb-KAN ViT: Hybrid Kolmogorov-Arnold Networks Augmented Vision Transformer	May 7, 2025	Edge DetectionInstance Segmentation	—Unverified	0
Self-Supervised Learning for Robotic Leaf Manipulation: A Hybrid Geometric-Neural Approach	May 6, 2025	3D Depth EstimationDepth Estimation	—Unverified	0
Segment Any RGB-Thermal Model with Language-aided Distillation	May 4, 2025	Instance SegmentationKnowledge Distillation	—Unverified	0
A Novel WaveInst-based Network for Tree Trunk Structure Extraction and Pattern Analysis in Forest Inventory	May 3, 2025	Instance SegmentationSemantic Segmentation	—Unverified	0
Global Collinearity-aware Polygonizer for Polygonal Building Mapping in Remote Sensing	May 2, 2025	Instance SegmentationSemantic Segmentation	—Unverified	0
MoSAM: Motion-Guided Segment Anything Model with Spatial-Temporal Memory Selection	Apr 30, 2025	Instance SegmentationInteractive Segmentation	—Unverified	0
OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation	Apr 29, 2025	Instance SegmentationSemantic Segmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified