Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 2262 papers

Title	Date	Tasks	Status
Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing	Jul 4, 2024	Code TranslationInstance Segmentation	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
Robot Instance Segmentation with Few Annotations for Grasping	Jul 1, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available
PanopticRecon: Leverage Open-vocabulary Instance Segmentation for Zero-shot Panoptic Reconstruction	Jul 1, 2024	3D Panoptic SegmentationInstance Segmentation	—Unverified
PM-VIS+: High-Performance Video Instance Segmentation without Video Annotation	Jun 28, 2024	Instance SegmentationSegmentation	CodeCode Available
3D Feature Distillation with Object-Centric Priors	Jun 26, 2024	3D Instance SegmentationInstance Segmentation	—Unverified
CoDA: Interactive Segmentation and Morphological Analysis of Dendroid Structures Exemplified on Stony Cold-Water Corals	Jun 26, 2024	Instance SegmentationInteractive Segmentation	CodeCode Available
XAMI -- A Benchmark Dataset for Artefact Detection in XMM-Newton Optical Images	Jun 25, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available
Optimization of Autonomous Driving Image Detection Based on RFAConv and Triplet Attention	Jun 25, 2024	Autonomous Drivingimage-classification	—Unverified
Depth-Guided Semi-Supervised Instance Segmentation	Jun 25, 2024	Depth EstimationInstance Segmentation	—Unverified
Semi-supervised classification of dental conditions in panoramic radiographs using large language model and instance segmentation: A real-world dataset evaluation	Jun 25, 2024	DiagnosticInstance Segmentation	—Unverified
GMT: Guided Mask Transformer for Leaf Instance Segmentation	Jun 24, 2024	Instance SegmentationSegmentation	CodeCode Available
Fine-grained Background Representation for Weakly Supervised Semantic Segmentation	Jun 22, 2024	Contrastive LearningInstance Segmentation	CodeCode Available
TraceNet: Segment one thing efficiently	Jun 21, 2024	Instance SegmentationInteractive Segmentation	—Unverified
2nd Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation	Jun 20, 2024	Instance SegmentationReferring Video Object Segmentation	—Unverified
3D Instance Segmentation Using Deep Learning on RGB-D Indoor Data	Jun 19, 2024	3D Instance Segmentation3D Object Recognition	—Unverified
Competitive Learning for Achieving Content-specific Filters in Video Coding for Machines	Jun 18, 2024	Instance Segmentationobject-detection	—Unverified
Benchmarking Label Noise in Instance Segmentation: Spatial Noise Matters	Jun 16, 2024	BenchmarkingInstance Segmentation	CodeCode Available
MMVR: Millimeter-wave Multi-View Radar Dataset and Benchmark for Indoor Perception	Jun 15, 2024	Autonomous Drivingenergy management	CodeCode Available
2nd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation	Jun 12, 2024	Instance SegmentationSemantic Segmentation	—Unverified
PanoSSC: Exploring Monocular Panoptic 3D Scene Reconstruction for Autonomous Driving	Jun 11, 2024	3D Instance Segmentation3D Scene Reconstruction	—Unverified
UVIS: Unsupervised Video Instance Segmentation	Jun 11, 2024	Instance SegmentationLanguage Modelling	—Unverified
Dual Thinking and Logical Processing -- Are Multi-modal Large Language Models Closing the Gap with Human Vision ?	Jun 11, 2024	Autonomous DrivingDeep Learning	CodeCode Available
RS-DFM: A Remote Sensing Distributed Foundation Model for Diverse Downstream Tasks	Jun 11, 2024	3D Object DetectionDepth Estimation	—Unverified
1st Place Winner of the 2024 Pixel-level Video Understanding in the Wild (CVPR'24 PVUW) Challenge in Video Panoptic Segmentation and Best Long Video Consistency of Video Semantic Segmentation	Jun 8, 2024	BenchmarkingInstance Segmentation	—Unverified
Nacala-Roof-Material: Drone Imagery for Roof Detection, Classification, and Segmentation to Support Mosquito-borne Disease Risk Assessment	Jun 7, 2024	DecoderInstance Segmentation	—Unverified
MultiPly: Reconstruction of Multiple People from Monocular Video in the Wild	Jun 3, 2024	DisentanglementHuman Dynamics	—Unverified
Layout Agnostic Scene Text Image Synthesis with Diffusion Models	Jun 3, 2024	DiversityImage Generation	—Unverified
MP-PolarMask: A Faster and Finer Instance Segmentation for Concave Images	Jun 3, 2024	Instance SegmentationSemantic Segmentation	—Unverified
An expert-driven data generation pipeline for histological images	Jun 3, 2024	Cell SegmentationInstance Segmentation	CodeCode Available
From Seedling to Harvest: The GrowingSoy Dataset for Weed Detection in Soy Crops via Instance Segmentation	Jun 1, 2024	image-classificationImage Classification	CodeCode Available
Extreme Point Supervised Instance Segmentation	May 31, 2024	Instance SegmentationPoint-Supervised Instance Segmentation	—Unverified
OpenDAS: Open-Vocabulary Domain Adaptation for 2D and 3D Segmentation	May 30, 2024	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	—Unverified
Reasoning3D -- Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models	May 29, 2024	3D Instance Segmentation3D Semantic Segmentation	—Unverified
BAISeg: Boundary Assisted Weakly Supervised Instance Segmentation	May 27, 2024	Boundary DetectionClustering	CodeCode Available
Understanding the Effect of using Semantically Meaningful Tokens for Visual Representation Learning	May 26, 2024	Image to textImage-to-Text Retrieval	—Unverified
Video Prediction Models as General Visual Encoders	May 25, 2024	Instance SegmentationPrediction	—Unverified
Efficient Temporal Action Segmentation via Boundary-aware Query Voting	May 25, 2024	Action SegmentationInstance Segmentation	CodeCode Available
Autonomous Quilt Spreading for Caregiving Robots	May 24, 2024	Instance SegmentationSemantic Segmentation	—Unverified
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations	May 23, 2024	Contrastive LearningInstance Segmentation	CodeCode Available
Unsupervised Pre-training with Language-Vision Prompts for Low-Data Instance Segmentation	May 22, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available
Vision Transformer with Sparse Scan Prior	May 22, 2024	Instance Segmentationobject-detection	CodeCode Available
Semantic Equitable Clustering: A Simple and Effective Strategy for Clustering Vision Tokens	May 22, 2024	Clusteringimage-classification	—Unverified
Improving the Explain-Any-Concept by Introducing Nonlinearity to the Trainable Surrogate Model	May 20, 2024	Instance SegmentationSemantic Segmentation	—Unverified
Unifying 3D Vision-Language Understanding via Promptable Queries	May 19, 2024	3D Question Answering (3D-QA)Decoder	—Unverified
UDA4Inst: Unsupervised Domain Adaptation for Instance Segmentation	May 15, 2024	Autonomous DrivingDomain Adaptation	—Unverified
PLUTO: Pathology-Universal Transformer	May 13, 2024	Instance SegmentationSemantic Segmentation	—Unverified
PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification	May 12, 2024	Data AugmentationInstance Segmentation	CodeCode Available
Global Motion Understanding in Large-Scale Video Object Segmentation	May 11, 2024	Instance SegmentationOptical Flow Estimation	—Unverified
CSA-Net: Channel-wise Spatially Autocorrelated Attention Networks	May 9, 2024	image-classificationImage Classification	CodeCode Available

Show:10 25 50

← PrevPage 22 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified