Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–825 of 2262 papers

Title	Date	Tasks	Status	Hype
MID-Fusion: Octree-based Object-Level Multi-Instance Dynamic SLAM	Dec 19, 2018	CPUInstance Segmentation	CodeCode Available	1
GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud	Dec 8, 2018	3D Instance Segmentation3D Object Detection	CodeCode Available	1
Efficient Attention: Attention with Linear Complexities	Dec 4, 2018	Depth EstimationExtractive Text Summarization	CodeCode Available	1
One-Shot Instance Segmentation	Nov 28, 2018	Few-Shot LearningFew-Shot Object Detection	CodeCode Available	1
Deformable ConvNets v2: More Deformable, Better Results	Nov 27, 2018	Instance SegmentationObject	CodeCode Available	1
Weakly- and Semi-Supervised Panoptic Segmentation	Aug 10, 2018	Instance SegmentationPanoptic Segmentation	CodeCode Available	1
BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning	May 12, 2018	Autonomous DrivingDiversity	CodeCode Available	1
The ApolloScape Open Dataset for Autonomous Driving and its Application	Mar 16, 2018	Autonomous DrivingInstance Segmentation	CodeCode Available	1
Path Aggregation Network for Instance Segmentation	Mar 5, 2018	Instance Segmentationobject-detection	CodeCode Available	1
Multiclass Weighted Loss for Instance Segmentation of Cluttered Cells	Feb 21, 2018	Instance SegmentationSemantic Segmentation	CodeCode Available	1
Panoptic Segmentation	Jan 3, 2018	Image SegmentationInstance Segmentation	CodeCode Available	1
High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs	Nov 30, 2017	Conditional Image GenerationFundus to Angiography Generation	CodeCode Available	1
Non-local Neural Networks	Nov 21, 2017	Action ClassificationAction Recognition	CodeCode Available	1
Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics	May 19, 2017	Deep LearningGeneral Classification	CodeCode Available	1
Mask R-CNN	Mar 20, 2017	3D Instance SegmentationHuman Part Segmentation	CodeCode Available	1
Microsoft COCO: Common Objects in Context	May 1, 2014	Instance SegmentationObject	CodeCode Available	1
SCORE: Scene Context Matters in Open-Vocabulary Remote Sensing Instance Segmentation	Jul 17, 2025	Earth ObservationInstance Segmentation	CodeCode Available	0
Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping	Jul 15, 2025	Instance Segmentationobject-detection	—Unverified	0
DreamGrasp: Zero-Shot 3D Multi-Object Reconstruction from Partial-View Images for Robotic Manipulation	Jul 8, 2025	3D geometry3D Reconstruction	—Unverified	0
SPADE: Spatial-Aware Denoising Network for Open-vocabulary Panoptic Scene Graph Generation with Long- and Local-range Context Reasoning	Jul 8, 2025	DenoisingGraph Generation	—Unverified	0
Beyond Appearance: Geometric Cues for Robust Video Instance Segmentation	Jul 8, 2025	Depth EstimationDepth Prediction	—Unverified	0
NOCTIS: Novel Object Cyclic Threshold based Instance Segmentation	Jul 2, 2025	Instance SegmentationObject	CodeCode Available	0
VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding	Jun 28, 2025	3DGSInstance Segmentation	—Unverified	0
Leader360V: The Large-scale, Real-world 360 Video Dataset for Multi-task Learning in Diverse Environment	Jun 17, 2025	Autonomous DrivingInstance Segmentation	—Unverified	0
A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects	Jun 16, 2025	BenchmarkingInstance Segmentation	—Unverified	0

Show:10 25 50

← PrevPage 33 of 91Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified