Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 2262 papers

Title	Date	Tasks	Status	Hype
Segment Anything for Histopathology	Feb 1, 2025	Image SegmentationInstance Segmentation	CodeCode Available	2
iFormer: Integrating ConvNet and Transformer for Mobile Application	Jan 26, 2025	Instance Segmentationobject-detection	CodeCode Available	2
RelationField: Relate Anything in Radiance Fields	Dec 18, 2024	3d scene graph generationGraph Generation	CodeCode Available	2
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection	Dec 12, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
DreamColour: Controllable Video Colour Editing without Training	Dec 6, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba	Nov 26, 2024	image-classificationImage Classification	CodeCode Available	2
DI-MaskDINO: A Joint Object Detection and Instance Segmentation Model	Oct 22, 2024	DecoderInstance Segmentation	CodeCode Available	2
Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation	Sep 24, 2024	DiversityInstance Segmentation	CodeCode Available	2
One missing piece in Vision and Language: A Survey on Comics Understanding	Sep 14, 2024	document understandingimage-classification	CodeCode Available	2
Image Segmentation in Foundation Model Era: A Survey	Aug 23, 2024	Image SegmentationInstance Segmentation	CodeCode Available	2
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications	Aug 7, 2024	image-classificationImage Classification	CodeCode Available	2
PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects	Jul 23, 2024	Instance SegmentationObject	CodeCode Available	2
GroupMamba: Efficient Group-Based Visual State Space Model	Jul 18, 2024	image-classificationImage Classification	CodeCode Available	2
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes	Jul 16, 2024	Human Instance SegmentationInstance Segmentation	CodeCode Available	2
Adaptive Parametric Activation	Jul 11, 2024	imbalanced classificationInstance Segmentation	CodeCode Available	2
Training-free CryoET Tomogram Segmentation	Jul 8, 2024	Contrastive LearningCryogenic Electron Tomography	CodeCode Available	2
Context-Aware Video Instance Segmentation	Jul 3, 2024	Instance SegmentationPanoptic Segmentation	CodeCode Available	2
Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset	Jun 10, 2024	Instance SegmentationSalient Object Detection	CodeCode Available	2
Generative Active Learning for Long-tailed Instance Segmentation	Jun 4, 2024	Active LearningInstance Segmentation	CodeCode Available	2
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation	May 28, 2024	Instance SegmentationObject Proposal Generation	CodeCode Available	2
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2
PTQ4SAM: Post-Training Quantization for Segment Anything	May 6, 2024	Instance Segmentationobject-detection	CodeCode Available	2
ViM-UNet: Vision Mamba for Biomedical Segmentation	Apr 11, 2024	Instance SegmentationMamba	CodeCode Available	2
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning	Mar 29, 2024	Continual LearningContinual Panoptic Segmentation	CodeCode Available	2
DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs	Mar 28, 2024	Fine-Grained Image ClassificationImage Classification	CodeCode Available	2
Aerial Lifting: Neural Urban Semantic and Building Instance Lifting from Aerial Imagery	Mar 18, 2024	Instance SegmentationNeRF	CodeCode Available	2
FusionVision: A comprehensive approach of 3D object reconstruction and segmentation from RGB-D cameras using YOLO and fast segment anything	Feb 29, 2024	3D Object ReconstructionInstance Segmentation	CodeCode Available	2
SPINEPS -- Automatic Whole Spine Segmentation of T2-weighted MR images using a Two-Phase Approach to Multi-class Semantic and Instance Segmentation	Feb 26, 2024	Instance SegmentationSegmentation	CodeCode Available	2
FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models	Feb 7, 2024	Instance SegmentationObject	CodeCode Available	2
SHViT: Single-Head Vision Transformer with Memory Efficient Macro Design	Jan 29, 2024	CPUGPU	CodeCode Available	2
Rethinking Patch Dependence for Masked Autoencoders	Jan 25, 2024	DecoderInstance Segmentation	CodeCode Available	2
A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting	Jan 18, 2024	Instance SegmentationInteractive Segmentation	CodeCode Available	2
OBSeg: Accurate and Fast Instance Segmentation Framework Using Segmentation Foundation Models with Oriented Bounding Box Prompts	Jan 16, 2024	Amodal Instance SegmentationInstance Segmentation	CodeCode Available	2
PartSTAD: 2D-to-3D Part Segmentation Task Adaptation	Jan 11, 2024	3D Part SegmentationForeground Segmentation	CodeCode Available	2
ODIN: A Single Model for 2D and 3D Segmentation	Jan 4, 2024	3D Instance Segmentation3D Semantic Segmentation	CodeCode Available	2
Unsupervised Universal Image Segmentation	Dec 28, 2023	Image SegmentationInstance Segmentation	CodeCode Available	2
SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete Diffusion Process	Dec 19, 2023	DenoisingDichotomous Image Segmentation	CodeCode Available	2
SAM-6D: Segment Anything Model Meets Zero-Shot 6D Object Pose Estimation	Nov 27, 2023	6D Pose Estimation using RGBInstance Segmentation	CodeCode Available	2
Adapter is All You Need for Tuning Visual Tasks	Nov 25, 2023	Allimage-classification	CodeCode Available	2
RMT: Retentive Networks Meet Vision Transformers	Sep 20, 2023	Instance Segmentationobject-detection	CodeCode Available	2
DAT++: Spatially Dynamic Vision Transformer with Deformable Attention	Sep 4, 2023	Image ClassificationInstance Segmentation	CodeCode Available	2
OpenIns3D: Snap and Lookup for 3D Open-vocabulary Instance Segmentation	Sep 1, 2023	3D Open-Vocabulary Instance Segmentation3D Open-Vocabulary Object Detection	CodeCode Available	2
DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models	Aug 11, 2023	Dataset GenerationDecoder	CodeCode Available	2
RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model	Jun 28, 2023	Image SegmentationInstance Segmentation	CodeCode Available	2
CellViT: Vision Transformers for Precise Cell Segmentation and Classification	Jun 27, 2023	Cell DetectionCell Segmentation	CodeCode Available	2
OpenMask3D: Open-Vocabulary 3D Instance Segmentation	Jun 23, 2023	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	CodeCode Available	2
Does Image Anonymization Impact Computer Vision Training?	Jun 8, 2023	Face AnonymizationInstance Segmentation	CodeCode Available	2
SAMRS: Scaling-up Remote Sensing Segmentation Dataset with Segment Anything Model	May 3, 2023	Instance SegmentationObject	CodeCode Available	2
RegionPLC: Regional Point-Language Contrastive Learning for Open-World 3D Scene Understanding	Apr 3, 2023	Contrastive LearningInstance Segmentation	CodeCode Available	2

Show:10 25 50

← PrevPage 2 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified