Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 2262 papers

Title	Date	Tasks	Status	Hype	Score
Dilated Neighborhood Attention Transformer	Sep 29, 2022	Image ClassificationInstance Segmentation	CodeCode Available	2	5
Mask2Former for Video Instance Segmentation	Dec 20, 2021	Image SegmentationInstance Segmentation	CodeCode Available	2	5
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2	5
Mask-Free Video Instance Segmentation	Mar 28, 2023	Instance SegmentationOptical Flow Estimation	CodeCode Available	2	5
MinVIS: A Minimal Video Instance Segmentation Framework without Video-based Training	Aug 3, 2022	Instance SegmentationSegmentation	CodeCode Available	2	5
DreamColour: Controllable Video Colour Editing without Training	Dec 6, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2	5
DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution	Jun 3, 2020	Instance SegmentationObject	CodeCode Available	2	5
Occlusion-Aware Instance Segmentation via BiLayer Network Architectures	Aug 8, 2022	Human Instance SegmentationInstance Segmentation	CodeCode Available	2	5
DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs	Mar 28, 2024	Fine-Grained Image ClassificationImage Classification	CodeCode Available	2	5
DiffusionInst: Diffusion Model for Instance Segmentation	Dec 6, 2022	DenoisingInstance Segmentation	CodeCode Available	2	5
E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation	Mar 8, 2022	GPUInstance Segmentation	CodeCode Available	2	5
DAT++: Spatially Dynamic Vision Transformer with Deformable Attention	Sep 4, 2023	Image ClassificationInstance Segmentation	CodeCode Available	2	5
P2Object: Single Point Supervised Object Detection and Instance Segmentation	Apr 10, 2025	Instance SegmentationMultiple Instance Learning	CodeCode Available	2	5
DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models	Aug 11, 2023	Dataset GenerationDecoder	CodeCode Available	2	5
PartSTAD: 2D-to-3D Part Segmentation Task Adaptation	Jan 11, 2024	3D Part SegmentationForeground Segmentation	CodeCode Available	2	5
DaViT: Dual Attention Vision Transformers	Apr 7, 2022	Computational EfficiencyImage Classification	CodeCode Available	2	5
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes	Jul 16, 2024	Human Instance SegmentationInstance Segmentation	CodeCode Available	2	5
RelationField: Relate Anything in Radiance Fields	Dec 18, 2024	3d scene graph generationGraph Generation	CodeCode Available	2	5
Revisiting Contrastive Methods for Unsupervised Learning of Visual Representations	Jun 10, 2021	Instance Segmentationobject-detection	CodeCode Available	2	5
RMT: Retentive Networks Meet Vision Transformers	Sep 20, 2023	Instance Segmentationobject-detection	CodeCode Available	2	5
DAMamba: Vision State Space Model with Dynamic Adaptive Scan	Feb 18, 2025	image-classificationImage Classification	CodeCode Available	2	5
Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks	May 5, 2021	image-classificationImage Classification	CodeCode Available	2	5
Scene-Centric Unsupervised Panoptic Segmentation	Apr 2, 2025	Instance SegmentationPanoptic Segmentation	CodeCode Available	2	5
Segment Anything for Histopathology	Feb 1, 2025	Image SegmentationInstance Segmentation	CodeCode Available	2	5
Deep Snake for Real-Time Instance Segmentation	Jan 6, 2020	GPUInstance Segmentation	CodeCode Available	2	5

Show:10 25 50

← PrevPage 5 of 91Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified