Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 2262 papers

Title	Date	Tasks	Status	Hype
AdaContour: Adaptive Contour Descriptor with Hierarchical Representation	Apr 12, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	0
Practical Guidelines for Cell Segmentation Models Under Optical Aberrations in Microscopy	Apr 12, 2024	BenchmarkingCell Segmentation	—Unverified	0
Let-It-Flow: Simultaneous Optimization of 3D Flow and Object Clustering	Apr 12, 2024	ClusteringInstance Segmentation	CodeCode Available	1
ViM-UNet: Vision Mamba for Biomedical Segmentation	Apr 11, 2024	Instance SegmentationMamba	CodeCode Available	2
Automated National Urban Map Extraction	Apr 9, 2024	Earth ObservationInstance Segmentation	—Unverified	0
Panoptic Perception: A Novel Task and Fine-grained Dataset for Universal Remote Sensing Image Interpretation	Apr 6, 2024	Image CaptioningInstance Segmentation	—Unverified	0
Language-Guided Instance-Aware Domain-Adaptive Panoptic Segmentation	Apr 4, 2024	Autonomous DrivingDomain Adaptation	—Unverified	0
OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioning	Apr 4, 2024	DescriptiveDiversity	—Unverified	0
CORP: A Multi-Modal Dataset for Campus-Oriented Roadside Perception Tasks	Apr 4, 2024	Autonomous DrivingInstance Segmentation	—Unverified	0
Segment Any 3D Object with Language	Apr 2, 2024	3D Instance SegmentationDecoder	—Unverified	0
Instance-Aware Group Quantization for Vision Transformers	Apr 1, 2024	image-classificationImage Classification	—Unverified	0
SUGAR: Pre-training 3D Visual Representations for Robotics	Apr 1, 2024	3D Instance Segmentation3D Object Recognition	—Unverified	0
Teeth-SEG: An Efficient Instance Segmentation Framework for Orthodontic Treatment based on Anthropic Prior Knowledge	Apr 1, 2024	Image SegmentationInstance Segmentation	—Unverified	0
What is Point Supervision Worth in Video Instance Segmentation?	Apr 1, 2024	Instance SegmentationObject	—Unverified	0
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning	Mar 29, 2024	Continual LearningContinual Panoptic Segmentation	CodeCode Available	2
Efficient 3D Instance Mapping and Localization with Neural Fields	Mar 28, 2024	3D Instance SegmentationImage Segmentation	—Unverified	0
DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs	Mar 28, 2024	Fine-Grained Image ClassificationImage Classification	CodeCode Available	2
Annolid: Annotate, Segment, and Track Anything You Need	Mar 27, 2024	Instance SegmentationSegmentation	CodeCode Available	0
Heracles: A Hybrid SSM-Transformer Model for High-Resolution Image and Time-Series Analysis	Mar 26, 2024	Inductive BiasInstance Segmentation	CodeCode Available	1
PlainMamba: Improving Non-Hierarchical Mamba in Visual Recognition	Mar 26, 2024	Image ClassificationInstance Segmentation	CodeCode Available	3
GoodSAM: Bridging Domain and Capacity Gaps via Segment Anything Model for Distortion-aware Panoramic Semantic Segmentation	Mar 25, 2024	Domain AdaptationInstance Segmentation	—Unverified	0
AutoInst: Automatic Instance-Based Segmentation of LiDAR 3D Scans	Mar 24, 2024	3D Instance SegmentationInstance Segmentation	CodeCode Available	1
Language-Based Depth Hints for Monocular Depth Estimation	Mar 22, 2024	Depth EstimationInstance Segmentation	—Unverified	0
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting	Mar 22, 2024	Instance SegmentationObject Localization	—Unverified	0
ParFormer: A Vision Transformer with Parallel Mixer and Sparse Channel Attention Patch Embedding	Mar 22, 2024	GPUImage Classification	—Unverified	0
BSNet: Box-Supervised Simulation-assisted Mean Teacher for 3D Instance Segmentation	Mar 22, 2024	3D Instance SegmentationDecoder	CodeCode Available	1
MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining	Mar 20, 2024	Aerial Scene ClassificationBuilding change detection for remote sensing images	CodeCode Available	3
CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation	Mar 19, 2024	DecoderInstance Segmentation	CodeCode Available	1
EffiPerception: an Efficient Framework for Various Perception Tasks	Mar 18, 2024	2D Object Detection3D Object Detection	—Unverified	0
Aerial Lifting: Neural Urban Semantic and Building Instance Lifting from Aerial Imagery	Mar 18, 2024	Instance SegmentationNeRF	CodeCode Available	2
Augment Before Copy-Paste: Data and Memory Efficiency-Oriented Instance Segmentation Framework for Sport-scenes	Mar 18, 2024	Data AugmentationInstance Segmentation	—Unverified	0
Circle Representation for Medical Instance Object Segmentation	Mar 18, 2024	Instance SegmentationObject	CodeCode Available	0
Better (pseudo-)labels for semi-supervised instance segmentation	Mar 18, 2024	Few-Shot Learningimage-classification	—Unverified	0
ShapeFormer: Shape Prior Visible-to-Amodal Transformer-based Amodal Instance Segmentation	Mar 18, 2024	Amodal Instance SegmentationInstance Segmentation	CodeCode Available	0
MISS: Memory-efficient Instance Segmentation Framework By Visual Inductive Priors Flow Propagation	Mar 18, 2024	Instance SegmentationSegmentation	—Unverified	0
Segment Any Object Model (SAOM): Real-to-Simulation Fine-Tuning Strategy for Multi-Class Multi-Instance Segmentation	Mar 16, 2024	Instance SegmentationObject	—Unverified	0
Grasp Anything: Combining Teacher-Augmented Policy Gradient Learning with Instance Segmentation to Grasp Arbitrary Objects	Mar 15, 2024	Instance SegmentationObject	—Unverified	0
When Semantic Segmentation Meets Frequency Aliasing	Mar 14, 2024	De-aliasingInstance Segmentation	CodeCode Available	1
WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity	Mar 14, 2024	Instance SegmentationInstrument Recognition	—Unverified	0
StainFuser: Controlling Diffusion for Faster Neural Style Transfer in Multi-Gigapixel Histology Images	Mar 14, 2024	Computational EfficiencyInstance Segmentation	CodeCode Available	1
Task-Specific Adaptation of Segmentation Foundation Model via Prompt Learning	Mar 14, 2024	Image SegmentationInstance Segmentation	—Unverified	0
ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature Interaction for Dense Predictions	Mar 13, 2024	Instance SegmentationObject Detection	CodeCode Available	3
Segmentation Guided Sparse Transformer for Under-Display Camera Image Restoration	Mar 9, 2024	Image RestorationInstance Segmentation	—Unverified	0
SAM-PD: How Far Can SAM Take Us in Tracking and Segmenting Anything in Videos by Prompt Denoising	Mar 7, 2024	DenoisingInstance Segmentation	CodeCode Available	0
CenterDisks: Real-time instance segmentation with disk covering	Mar 5, 2024	GPUInstance Segmentation	CodeCode Available	0
MCA: Moment Channel Attention Networks	Mar 4, 2024	image-classificationImage Classification	CodeCode Available	0
RISeg: Robot Interactive Object Segmentation via Body Frame-Invariant Features	Mar 4, 2024	Instance SegmentationObject	—Unverified	0
End-to-End Human Instance Matting	Mar 3, 2024	Image MattingInstance Segmentation	CodeCode Available	1
Self-Supervised Representation Learning with Meta Comprehensive Regularization	Mar 3, 2024	counterfactualData Augmentation	—Unverified	0
Boosting Box-supervised Instance Segmentation with Pseudo Depth	Mar 2, 2024	Box-supervised Instance SegmentationDepth Estimation	—Unverified	0

Show:10 25 50

← PrevPage 9 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
9	GLEE-Pro	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified