Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 2262 papers

Title	Date	Tasks	Status	Hype
Decoupled Motion Expression Video Segmentation	Jan 1, 2025	Instance SegmentationReferring Video Object Segmentation	—Unverified	0
Semantic and Sequential Alignment for Referring Video Object Segmentation	Jan 1, 2025	Instance SegmentationReferring Video Object Segmentation	—Unverified	0
Insightful Instance Features for 3D Instance Segmentation	Jan 1, 2025	3D Instance SegmentationInstance Segmentation	—Unverified	0
DefMamba: Deformable Visual State Space Model	Jan 1, 2025	Computational Efficiencyimage-classification	—Unverified	0
PolarNeXt: Rethink Instance Segmentation with Polar Representation	Jan 1, 2025	Instance SegmentationSegmentation	—Unverified	0
PanoSLAM: Panoptic 3D Scene Reconstruction via Gaussian SLAM	Dec 31, 2024	3D Instance Segmentation3D Reconstruction	CodeCode Available	0
A Novel Shape Guided Transformer Network for Instance Segmentation in Remote Sensing Images	Dec 31, 2024	Instance SegmentationSegmentation	—Unverified	0
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers	Dec 19, 2024	Instance SegmentationPOS	—Unverified	0
RelationField: Relate Anything in Radiance Fields	Dec 18, 2024	3d scene graph generationGraph Generation	CodeCode Available	2
ZoRI: Towards Discriminative Zero-Shot Remote Sensing Instance Segmentation	Dec 17, 2024	Instance SegmentationSegmentation	CodeCode Available	1
PyPotteryLens: An Open-Source Deep Learning Framework for Automated Digitisation of Archaeological Pottery Documentation	Dec 16, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	0
SAM-IF: Leveraging SAM for Incremental Few-Shot Instance Segmentation	Dec 15, 2024	DecoderFew-shot Instance Segmentation	—Unverified	0
Classification Drives Geographic Bias in Street Scene Segmentation	Dec 15, 2024	ClassificationDiversity	—Unverified	0
RapidNet: Multi-Level Dilated Convolution Based Mobile Backbone	Dec 14, 2024	image-classificationImage Classification	CodeCode Available	1
STEAM: Squeeze and Transform Enhanced Attention Module	Dec 12, 2024	image-classificationImage Classification	—Unverified	0
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection	Dec 12, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
Open-Vocabulary High-Resolution 3D (OVHR3D) Data Segmentation and Annotation Framework	Dec 9, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Integrating YOLO11 and Convolution Block Attention Module for Multi-Season Segmentation of Tree Trunks and Branches in Commercial Apple Orchards	Dec 7, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
DreamColour: Controllable Video Colour Editing without Training	Dec 6, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
Towards Real-Time Open-Vocabulary Video Instance Segmentation	Dec 5, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	0
Vision Transformers for Weakly-Supervised Microorganism Enumeration	Dec 3, 2024	Density EstimationInstance Segmentation	CodeCode Available	0
A2VIS: Amodal-Aware Approach to Video Instance Segmentation	Dec 2, 2024	Instance SegmentationMultiple Object Tracking	—Unverified	0
3DSceneEditor: Controllable 3D Scene Editing with Gaussian Splatting	Dec 2, 2024	3D scene EditingImage to 3D	—Unverified	0
Holistic Understanding of 3D Scenes as Universal Scene Description	Dec 2, 2024	Instance SegmentationMixed Reality	—Unverified	0
Token Cropr: Faster ViTs for Quite a Few Tasks	Dec 1, 2024	image-classificationImage Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 7 of 91Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified