Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 2262 papers

Title	Date	Tasks	Status	Hype
Segment Anything for Histopathology	Feb 1, 2025	Image SegmentationInstance Segmentation	CodeCode Available	2
iFormer: Integrating ConvNet and Transformer for Mobile Application	Jan 26, 2025	Instance Segmentationobject-detection	CodeCode Available	2
RelationField: Relate Anything in Radiance Fields	Dec 18, 2024	3d scene graph generationGraph Generation	CodeCode Available	2
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection	Dec 12, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
DreamColour: Controllable Video Colour Editing without Training	Dec 6, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba	Nov 26, 2024	image-classificationImage Classification	CodeCode Available	2
DI-MaskDINO: A Joint Object Detection and Instance Segmentation Model	Oct 22, 2024	DecoderInstance Segmentation	CodeCode Available	2
Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation	Sep 24, 2024	DiversityInstance Segmentation	CodeCode Available	2
One missing piece in Vision and Language: A Survey on Comics Understanding	Sep 14, 2024	document understandingimage-classification	CodeCode Available	2
Image Segmentation in Foundation Model Era: A Survey	Aug 23, 2024	Image SegmentationInstance Segmentation	CodeCode Available	2
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications	Aug 7, 2024	image-classificationImage Classification	CodeCode Available	2
PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects	Jul 23, 2024	Instance SegmentationObject	CodeCode Available	2
GroupMamba: Efficient Group-Based Visual State Space Model	Jul 18, 2024	image-classificationImage Classification	CodeCode Available	2
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes	Jul 16, 2024	Human Instance SegmentationInstance Segmentation	CodeCode Available	2
Adaptive Parametric Activation	Jul 11, 2024	imbalanced classificationInstance Segmentation	CodeCode Available	2
Training-free CryoET Tomogram Segmentation	Jul 8, 2024	Contrastive LearningCryogenic Electron Tomography	CodeCode Available	2
Context-Aware Video Instance Segmentation	Jul 3, 2024	Instance SegmentationPanoptic Segmentation	CodeCode Available	2
Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset	Jun 10, 2024	Instance SegmentationSalient Object Detection	CodeCode Available	2
Generative Active Learning for Long-tailed Instance Segmentation	Jun 4, 2024	Active LearningInstance Segmentation	CodeCode Available	2
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation	May 28, 2024	Instance SegmentationObject Proposal Generation	CodeCode Available	2
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2
PTQ4SAM: Post-Training Quantization for Segment Anything	May 6, 2024	Instance Segmentationobject-detection	CodeCode Available	2
ViM-UNet: Vision Mamba for Biomedical Segmentation	Apr 11, 2024	Instance SegmentationMamba	CodeCode Available	2
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning	Mar 29, 2024	Continual LearningContinual Panoptic Segmentation	CodeCode Available	2

Show:10 25 50

← PrevPage 3 of 91Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified