Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 2262 papers

Title	Date	Tasks	Status	Hype
Improving Convolutional Networks With Self-Calibrated Convolutions	Jun 1, 2020	Instance SegmentationKeypoint Detection	CodeCode Available	1
MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation	Sep 22, 2023	Data AugmentationInstance Segmentation	CodeCode Available	1
MPViT: Multi-Path Vision Transformer for Dense Prediction	Dec 21, 2021	Instance Segmentationobject-detection	CodeCode Available	1
MSeg: A Composite Dataset for Multi-domain Semantic Segmentation	Dec 27, 2021	Computational EfficiencyInstance Segmentation	CodeCode Available	1
Incremental Few-Shot Instance Segmentation	May 11, 2021	Few-shot Instance SegmentationInstance Segmentation	CodeCode Available	1
Deep learning approaches to building rooftop thermal bridge detection from aerial images	Dec 12, 2022	Instance SegmentationObject Detection	CodeCode Available	1
Fashionpedia: Ontology, Segmentation, and an Attribute Localization Dataset	Apr 26, 2020	AttributeFine-Grained Visual Categorization	CodeCode Available	1
Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function	Jan 2, 2025	Instance SegmentationSegmentation	CodeCode Available	1
Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics	May 19, 2017	Deep LearningGeneral Classification	CodeCode Available	1
NDD20: A large-scale few-shot dolphin dataset for coarse and fine-grained categorisation	May 27, 2020	Instance SegmentationSegmentation	CodeCode Available	1
Human Instance Matting via Mutual Guidance and Multi-Instance Refinement	May 22, 2022	Image MattingInstance Segmentation	CodeCode Available	1
Efficient Multi-Task RGB-D Scene Analysis for Indoor Environments	Jul 10, 2022	Instance SegmentationPanoptic Segmentation	CodeCode Available	1
UVO Challenge on Video-based Open-World Segmentation 2021: 1st Place Solution	Oct 22, 2021	Instance SegmentationOptical Flow Estimation	CodeCode Available	1
EfficientPS: Efficient Panoptic Segmentation	Apr 5, 2020	Instance SegmentationPanoptic Segmentation	CodeCode Available	1
Humans need not label more humans: Occlusion Copy & Paste for Occluded Human Instance Segmentation	Oct 7, 2022	Human Instance SegmentationInstance Segmentation	CodeCode Available	1
HoVer-UNet: Accelerating HoVerNet with UNet-based multi-class nuclei segmentation via knowledge distillation	Nov 21, 2023	Instance SegmentationKnowledge Distillation	CodeCode Available	1
BSNet: Box-Supervised Simulation-assisted Mean Teacher for 3D Instance Segmentation	Mar 22, 2024	3D Instance SegmentationDecoder	CodeCode Available	1
Nucleus-aware Self-supervised Pretraining Using Unpaired Image-to-image Translation for Histopathology Images	Sep 14, 2023	DiversityImage-to-Image Translation	CodeCode Available	1
NucMM Dataset: 3D Neuronal Nuclei Instance Segmentation at Sub-Cubic Millimeter Scale	Jul 13, 2021	Instance SegmentationRepresentation Learning	CodeCode Available	1
HoughNet: Integrating near and long-range evidence for visual detection	Apr 14, 2021	3D Object DetectionImage Generation	CodeCode Available	1
HS-ResNet: Hierarchical-Split Block on Convolutional Neural Network	Oct 15, 2020	image-classificationImage Classification	CodeCode Available	1
Hybrid Task Cascade for Instance Segmentation	Jan 22, 2019	Instance Segmentationobject-detection	CodeCode Available	1
Deep High-Resolution Representation Learning for Human Pose Estimation	Feb 25, 2019	2D Human Pose Estimation2D Pose Estimation	CodeCode Available	1
BARS: A Benchmark for Airport Runway Segmentation	Oct 24, 2022	Instance SegmentationSegmentation	CodeCode Available	1
HistoSmith: Single-Stage Histology Image-Label Generation via Conditional Latent Diffusion for Enhanced Cell Segmentation and Classification	Feb 12, 2025	Cell SegmentationImage Generation	CodeCode Available	1
OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation	Apr 29, 2025	Instance SegmentationSemantic Segmentation	CodeCode Available	1
ElC-OIS: Ellipsoidal Clustering for Open-World Instance Segmentation on LiDAR Data	Mar 8, 2023	Autonomous NavigationClustering	CodeCode Available	1
ELSA: Enhanced Local Self-Attention for Vision Transformer	Dec 23, 2021	Image ClassificationInstance Segmentation	CodeCode Available	1
Hierarchical Approach for Joint Semantic, Plant Instance, and Leaf Instance Segmentation in the Agricultural Domain	Oct 14, 2022	Instance SegmentationPlant Phenotyping	CodeCode Available	1
Hierarchical Aggregation for 3D Instance Segmentation	Aug 5, 2021	3D Instance SegmentationClustering	CodeCode Available	1
High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs	Nov 30, 2017	Conditional Image GenerationFundus to Angiography Generation	CodeCode Available	1
Segmenting Known Objects and Unseen Unknowns without Prior Knowledge	Sep 12, 2022	Instance SegmentationObject Detection	CodeCode Available	1
You Only Need One Thing One Click: Self-Training for Weakly Supervised 3D Scene Understanding	Mar 26, 2023	3D Instance SegmentationInstance Segmentation	CodeCode Available	1
EM-Paste: EM-guided Cut-Paste with DALL-E Augmentation for Image-level Weakly Supervised Instance Segmentation	Dec 15, 2022	Instance SegmentationObject	CodeCode Available	1
On Model Calibration for Long-Tailed Object Detection and Instance Segmentation	Jul 5, 2021	Instance SegmentationLong-tailed Object Detection	CodeCode Available	1
On Point Affiliation in Feature Upsampling	Jul 17, 2023	DecoderDepth Estimation	CodeCode Available	1
iBOT: Image BERT Pre-Training with Online Tokenizer	Nov 15, 2021	image-classificationImage Classification	CodeCode Available	1
End-to-End Human Instance Matting	Mar 3, 2024	Image MattingInstance Segmentation	CodeCode Available	1
A One Stop 3D Target Reconstruction and multilevel Segmentation Method	Aug 14, 2023	3D Object Reconstruction3D Reconstruction	CodeCode Available	1
OpenVIS: Open-vocabulary Video Instance Segmentation	May 26, 2023	Instance SegmentationSegmentation	CodeCode Available	1
GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud	Dec 8, 2018	3D Instance Segmentation3D Object Detection	CodeCode Available	1
Balanced Meta-Softmax for Long-Tailed Visual Recognition	Jul 21, 2020	General ClassificationInstance Segmentation	CodeCode Available	1
End-to-End Referring Video Object Segmentation with Multimodal Transformers	Nov 29, 2021	Inductive BiasInstance Segmentation	CodeCode Available	1
End-to-End Semi-Supervised Object Detection with Soft Teacher	Jun 16, 2021	Instance Segmentationobject-detection	CodeCode Available	1
Guided Distillation for Semi-Supervised Instance Segmentation	Aug 3, 2023	Instance SegmentationSemantic Segmentation	CodeCode Available	1
GRIT: General Robust Image Task Benchmark	Apr 28, 2022	Instance SegmentationKeypoint Detection	CodeCode Available	1
P2T: Pyramid Pooling Transformer for Scene Understanding	Jun 22, 2021	image-classificationImage Classification	CodeCode Available	1
FcaNet: Frequency Channel Attention Networks	Dec 22, 2020	image-classificationImage Classification	CodeCode Available	1
All in Tokens: Unifying Output Space of Visual Tasks via Soft Token	Jan 5, 2023	AllDepth Estimation	CodeCode Available	1
H2RBox: Horizontal Box Annotation is All You Need for Oriented Object Detection	Oct 13, 2022	AllAutonomous Driving	CodeCode Available	1

Show:10 25 50

← PrevPage 14 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
9	GLEE-Pro	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified