Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 2262 papers

Title	Date	Tasks	Status	Hype
MP-PolarMask: A Faster and Finer Instance Segmentation for Concave Images	Jun 3, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Layout Agnostic Scene Text Image Synthesis with Diffusion Models	Jun 3, 2024	DiversityImage Generation	—Unverified	0
MultiPly: Reconstruction of Multiple People from Monocular Video in the Wild	Jun 3, 2024	DisentanglementHuman Dynamics	—Unverified	0
An expert-driven data generation pipeline for histological images	Jun 3, 2024	Cell SegmentationInstance Segmentation	CodeCode Available	0
From Seedling to Harvest: The GrowingSoy Dataset for Weed Detection in Soy Crops via Instance Segmentation	Jun 1, 2024	image-classificationImage Classification	CodeCode Available	0
Extreme Point Supervised Instance Segmentation	May 31, 2024	Instance SegmentationPoint-Supervised Instance Segmentation	—Unverified	0
OpenDAS: Open-Vocabulary Domain Adaptation for 2D and 3D Segmentation	May 30, 2024	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	—Unverified	0
Reasoning3D -- Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models	May 29, 2024	3D Instance Segmentation3D Semantic Segmentation	—Unverified	0
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation	May 28, 2024	Instance SegmentationObject Proposal Generation	CodeCode Available	2
BAISeg: Boundary Assisted Weakly Supervised Instance Segmentation	May 27, 2024	Boundary DetectionClustering	CodeCode Available	0
Understanding the Effect of using Semantically Meaningful Tokens for Visual Representation Learning	May 26, 2024	Image to textImage-to-Text Retrieval	—Unverified	0
Video Prediction Models as General Visual Encoders	May 25, 2024	Instance SegmentationPrediction	—Unverified	0
Efficient Temporal Action Segmentation via Boundary-aware Query Voting	May 25, 2024	Action SegmentationInstance Segmentation	CodeCode Available	0
Autonomous Quilt Spreading for Caregiving Robots	May 24, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations	May 23, 2024	Contrastive LearningInstance Segmentation	CodeCode Available	0
PerSense: Personalized Instance Segmentation in Dense Images	May 22, 2024	Instance SegmentationLanguage Modelling	CodeCode Available	1
Unsupervised Pre-training with Language-Vision Prompts for Low-Data Instance Segmentation	May 22, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	0
Vision Transformer with Sparse Scan Prior	May 22, 2024	Instance Segmentationobject-detection	CodeCode Available	0
Semantic Equitable Clustering: A Simple and Effective Strategy for Clustering Vision Tokens	May 22, 2024	Clusteringimage-classification	—Unverified	0
Improving the Explain-Any-Concept by Introducing Nonlinearity to the Trainable Surrogate Model	May 20, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Unifying 3D Vision-Language Understanding via Promptable Queries	May 19, 2024	3D Question Answering (3D-QA)Decoder	—Unverified	0
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2
UDA4Inst: Unsupervised Domain Adaptation for Instance Segmentation	May 15, 2024	Autonomous DrivingDomain Adaptation	—Unverified	0
PLUTO: Pathology-Universal Transformer	May 13, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
MambaOut: Do We Really Need Mamba for Vision?	May 13, 2024	image-classificationImage Classification	CodeCode Available	7
PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification	May 12, 2024	Data AugmentationInstance Segmentation	CodeCode Available	0
Global Motion Understanding in Large-Scale Video Object Segmentation	May 11, 2024	Instance SegmentationOptical Flow Estimation	—Unverified	0
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2
CSA-Net: Channel-wise Spatially Autocorrelated Attention Networks	May 9, 2024	image-classificationImage Classification	CodeCode Available	0
AugmenTory: A Fast and Flexible Polygon Augmentation Library	May 7, 2024	Data AugmentationInstance Segmentation	CodeCode Available	1
A Self-Supervised Method for Body Part Segmentation and Keypoint Detection of Rat Images	May 7, 2024	Instance SegmentationKeypoint Detection	—Unverified	0
PTQ4SAM: Post-Training Quantization for Segment Anything	May 6, 2024	Instance Segmentationobject-detection	CodeCode Available	2
Towards general deep-learning-based tree instance segmentation models	May 3, 2024	Deep LearningInstance Segmentation	—Unverified	0
UniFS: Universal Few-shot Instance Perception with Point Representations	Apr 30, 2024	Few-Shot LearningFew-Shot Object Detection	CodeCode Available	1
From Density to Geometry: YOLOv8 Instance Segmentation for Reverse Engineering of Optimized Structures	Apr 29, 2024	Instance Segmentation	CodeCode Available	0
Self-Balanced R-CNN for Instance Segmentation	Apr 25, 2024	Instance Segmentationobject-detection	CodeCode Available	0
PM-VIS: High-Performance Box-Supervised Video Instance Segmentation	Apr 22, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
Surgical-DeSAM: Decoupling SAM for Instrument Segmentation in Robotic Surgery	Apr 22, 2024	Instance SegmentationSegmentation	CodeCode Available	1
FisheyeDetNet: 360° Surround view Fisheye Camera based Object Detection System for Autonomous Driving	Apr 20, 2024	ARCAutonomous Driving	—Unverified	0
FipTR: A Simple yet Effective Transformer Framework for Future Instance Prediction in Autonomous Driving	Apr 19, 2024	Autonomous DrivingInstance Segmentation	CodeCode Available	1
Nuclei Instance Segmentation of Cryosectioned H&E Stained Histological Images using Triple U-Net Architecture	Apr 19, 2024	Instance SegmentationMedical Diagnosis	—Unverified	0
Spot-Compose: A Framework for Open-Vocabulary Object Retrieval and Drawer Manipulation in Point Clouds	Apr 18, 2024	3D Instance SegmentationInstance Segmentation	—Unverified	0
Performance Evaluation of Segment Anything Model with Variational Prompting for Application to Non-Visible Spectrum Imagery	Apr 18, 2024	Instance SegmentationSemantic Segmentation	—Unverified	0
The devil is in the object boundary: towards annotation-free instance segmentation using Foundation Models	Apr 18, 2024	Instance SegmentationObject	CodeCode Available	1
Mushroom Segmentation and 3D Pose Estimation from Point Clouds using Fully Convolutional Geometric Features and Implicit Pose Encoding	Apr 17, 2024	3D Pose EstimationInstance Segmentation	CodeCode Available	0
Criteria for Uncertainty-based Corner Cases Detection in Instance Segmentation	Apr 17, 2024	Instance SegmentationNavigate	—Unverified	0
UruDendro, a public dataset of cross-section images of Pinus taeda	Apr 16, 2024	Boundary DetectionInstance Segmentation	CodeCode Available	0
NOISe: Nuclei-Aware Osteoclast Instance Segmentation for Mouse-to-Human Domain Transfer	Apr 15, 2024	Instance SegmentationSegmentation	CodeCode Available	0
SEVD: Synthetic Event-based Vision Dataset for Ego and Fixed Traffic Perception	Apr 12, 2024	Autonomous DrivingEvent-based vision	CodeCode Available	1
Structured Model Pruning for Efficient Inference in Computational Pathology	Apr 12, 2024	Instance SegmentationModel Compression	—Unverified	0

Show:10 25 50

← PrevPage 8 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
9	GLEE-Pro	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified