Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–375 of 2262 papers

Title	Date	Tasks	Status	Hype
MP-PolarMask: A Faster and Finer Instance Segmentation for Concave Images	Jun 3, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
MultiPly: Reconstruction of Multiple People from Monocular Video in the Wild	Jun 3, 2024	DisentanglementHuman Dynamics	—Unverified	0
An expert-driven data generation pipeline for histological images	Jun 3, 2024	Cell SegmentationInstance Segmentation	CodeCode Available	0
Layout Agnostic Scene Text Image Synthesis with Diffusion Models	Jun 3, 2024	DiversityImage Generation	—Unverified	0
From Seedling to Harvest: The GrowingSoy Dataset for Weed Detection in Soy Crops via Instance Segmentation	Jun 1, 2024	image-classificationImage Classification	CodeCode Available	0
Extreme Point Supervised Instance Segmentation	May 31, 2024	Instance SegmentationPoint-Supervised Instance Segmentation	—Unverified	0
OpenDAS: Open-Vocabulary Domain Adaptation for 2D and 3D Segmentation	May 30, 2024	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	—Unverified	0
Reasoning3D -- Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models	May 29, 2024	3D Instance Segmentation3D Semantic Segmentation	—Unverified	0
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation	May 28, 2024	Instance SegmentationObject Proposal Generation	CodeCode Available	2
BAISeg: Boundary Assisted Weakly Supervised Instance Segmentation	May 27, 2024	Boundary DetectionClustering	CodeCode Available	0
Understanding the Effect of using Semantically Meaningful Tokens for Visual Representation Learning	May 26, 2024	Image to textImage-to-Text Retrieval	—Unverified	0
Video Prediction Models as General Visual Encoders	May 25, 2024	Instance SegmentationPrediction	—Unverified	0
Efficient Temporal Action Segmentation via Boundary-aware Query Voting	May 25, 2024	Action SegmentationInstance Segmentation	CodeCode Available	0
Autonomous Quilt Spreading for Caregiving Robots	May 24, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations	May 23, 2024	Contrastive LearningInstance Segmentation	CodeCode Available	0
Vision Transformer with Sparse Scan Prior	May 22, 2024	Instance Segmentationobject-detection	CodeCode Available	0
PerSense: Personalized Instance Segmentation in Dense Images	May 22, 2024	Instance SegmentationLanguage Modelling	CodeCode Available	1
Unsupervised Pre-training with Language-Vision Prompts for Low-Data Instance Segmentation	May 22, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	0
Semantic Equitable Clustering: A Simple and Effective Strategy for Clustering Vision Tokens	May 22, 2024	Clusteringimage-classification	—Unverified	0
Improving the Explain-Any-Concept by Introducing Nonlinearity to the Trainable Surrogate Model	May 20, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Unifying 3D Vision-Language Understanding via Promptable Queries	May 19, 2024	3D Question Answering (3D-QA)Decoder	—Unverified	0
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2
UDA4Inst: Unsupervised Domain Adaptation for Instance Segmentation	May 15, 2024	Autonomous DrivingDomain Adaptation	—Unverified	0
MambaOut: Do We Really Need Mamba for Vision?	May 13, 2024	image-classificationImage Classification	CodeCode Available	7
PLUTO: Pathology-Universal Transformer	May 13, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0

Show:10 25 50

← PrevPage 15 of 91Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
9	GLEE-Pro	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified