Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 2262 papers

Title	Date	Tasks	Status	Hype
Box-supervised Instance Segmentation with Level Set Evolution	Jul 19, 2022	Box-supervised Instance SegmentationInstance Segmentation	CodeCode Available	2
Mask2Former for Video Instance Segmentation	Dec 20, 2021	Image SegmentationInstance Segmentation	CodeCode Available	2
DiffusionInst: Diffusion Model for Instance Segmentation	Dec 6, 2022	DenoisingInstance Segmentation	CodeCode Available	2
Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset	Jun 10, 2024	Instance SegmentationSalient Object Detection	CodeCode Available	2
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications	Aug 7, 2024	image-classificationImage Classification	CodeCode Available	2
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection	Dec 12, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting	Jan 18, 2024	Instance SegmentationInteractive Segmentation	CodeCode Available	2
DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs	Mar 28, 2024	Fine-Grained Image ClassificationImage Classification	CodeCode Available	2
Delineate Anything: Resolution-Agnostic Field Boundary Delineation on Satellite Imagery	Apr 3, 2025	Field Boundary DelineationInstance Segmentation	CodeCode Available	2
Aerial Lifting: Neural Urban Semantic and Building Instance Lifting from Aerial Imagery	Mar 18, 2024	Instance SegmentationNeRF	CodeCode Available	2
DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution	Jun 3, 2020	Instance SegmentationObject	CodeCode Available	2
Does Image Anonymization Impact Computer Vision Training?	Jun 8, 2023	Face AnonymizationInstance Segmentation	CodeCode Available	2
DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models	Aug 11, 2023	Dataset GenerationDecoder	CodeCode Available	2
DAMamba: Vision State Space Model with Dynamic Adaptive Scan	Feb 18, 2025	image-classificationImage Classification	CodeCode Available	2
Panoptic NeRF: 3D-to-2D Label Transfer for Panoptic Urban Scene Segmentation	Mar 29, 2022	Instance SegmentationNeRF	CodeCode Available	2
PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects	Jul 23, 2024	Instance SegmentationObject	CodeCode Available	2
DAT++: Spatially Dynamic Vision Transformer with Deformable Attention	Sep 4, 2023	Image ClassificationInstance Segmentation	CodeCode Available	2
PTQ4SAM: Post-Training Quantization for Segment Anything	May 6, 2024	Instance Segmentationobject-detection	CodeCode Available	2
Rethinking End-to-End 2D to 3D Scene Segmentation in Gaussian Splatting	Mar 18, 2025	Instance SegmentationObject	CodeCode Available	2
Rethinking Patch Dependence for Masked Autoencoders	Jan 25, 2024	DecoderInstance Segmentation	CodeCode Available	2
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes	Jul 16, 2024	Human Instance SegmentationInstance Segmentation	CodeCode Available	2
RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model	Jun 28, 2023	Image SegmentationInstance Segmentation	CodeCode Available	2
SAMRS: Scaling-up Remote Sensing Segmentation Dataset with Segment Anything Model	May 3, 2023	Instance SegmentationObject	CodeCode Available	2
Scene-Centric Unsupervised Panoptic Segmentation	Apr 2, 2025	Instance SegmentationPanoptic Segmentation	CodeCode Available	2
DaViT: Dual Attention Vision Transformers	Apr 7, 2022	Computational EfficiencyImage Classification	CodeCode Available	2

Show:10 25 50

← PrevPage 5 of 91Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
9	GLEE-Pro	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified