Instance Segmentation

Instance Segmentation is a computer vision task that involves identifying and separating individual objects within an image, including detecting the boundaries of each object and assigning a unique label to each object. The goal of instance segmentation is to produce a pixel-wise segmentation map of the image, where each pixel is assigned to a specific object instance.

Image Credit: Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers, CVPR'21

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 2262 papers

Title	Date	Tasks	Status	Hype
GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers	Jul 25, 2023	3D Instance SegmentationGaussian Processes	CodeCode Available	1
DocSegTr: An Instance-Level End-to-End Document Image Segmentation Transformer	Jan 27, 2022	Decision MakingDocument Layout Analysis	CodeCode Available	1
Evaluation of Segment Anything Model 2: The Role of SAM2 in the Underwater Environment	Aug 6, 2024	Instance SegmentationSegmentation	CodeCode Available	1
3D Indoor Instance Segmentation in an Open-World	Sep 25, 2023	3D Instance SegmentationInstance Segmentation	CodeCode Available	1
Distribution Alignment: A Unified Framework for Long-tail Visual Recognition	Mar 30, 2021	General Classificationimage-classification	CodeCode Available	1
DeepSportradar-v1: Computer Vision Dataset for Sports Understanding with High Quality Annotations	Aug 17, 2022	Camera CalibrationInstance Segmentation	CodeCode Available	1
BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning	May 12, 2018	Autonomous DrivingDiversity	CodeCode Available	1
Divide and Conquer: 3D Point Cloud Instance Segmentation With Point-Wise Binarization	Jul 22, 2022	3D Instance Segmentation3D Object Detection	CodeCode Available	1
GAInS: Gradient Anomaly-aware Biomedical Instance Segmentation	Sep 21, 2024	Instance SegmentationSegmentation	CodeCode Available	1
3D Instances as 1D Kernels	Jul 15, 2022	3D Instance SegmentationInstance Segmentation	CodeCode Available	1
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation	Jan 2, 2023	Caption GenerationInstance Segmentation	CodeCode Available	1
Test-time Adaptation with Slot-Centric Models	Mar 21, 2022	image-classificationImage Classification	CodeCode Available	1
GradAug: A New Regularization Method for Deep Neural Networks	Jun 14, 2020	Instance Segmentationobject-detection	CodeCode Available	1
Amodal Intra-class Instance Segmentation: Synthetic Datasets and Benchmark	Mar 12, 2023	Amodal Instance SegmentationInstance Segmentation	CodeCode Available	1
GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud	Dec 8, 2018	3D Instance Segmentation3D Object Detection	CodeCode Available	1
Human Instance Matting via Mutual Guidance and Multi-Instance Refinement	May 22, 2022	Image MattingInstance Segmentation	CodeCode Available	1
Delving Deeper into Anti-aliasing in ConvNets	Aug 21, 2020	Instance SegmentationSegmentation	CodeCode Available	1
DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting	Dec 2, 2021	Image-text matchingInstance Segmentation	CodeCode Available	1
Dense Contrastive Learning for Self-Supervised Visual Pre-Training	Nov 18, 2020	Contrastive Learningimage-classification	CodeCode Available	1
Deep-learning in the bioimaging wild: Handling ambiguous data with deepflash2	Nov 12, 2021	Deep LearningInstance Segmentation	CodeCode Available	1
BBAM: Bounding Box Attribution Map for Weakly Supervised Semantic and Instance Segmentation	Mar 16, 2021	Box-supervised Instance SegmentationInstance Segmentation	CodeCode Available	1
High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs	Nov 30, 2017	Conditional Image GenerationFundus to Angiography Generation	CodeCode Available	1
Beyond Semantic to Instance Segmentation: Weakly-Supervised Instance Segmentation via Semantic Knowledge Transfer and Self-Refinement	Sep 20, 2021	Image-level Supervised Instance SegmentationInstance Segmentation	CodeCode Available	1
Depth-aware Object Segmentation and Grasp Detection for Robotic Picking Tasks	Nov 22, 2021	Instance SegmentationObject	CodeCode Available	1
FourierNet: Compact mask representation for instance segmentation using differentiable shape decoders	Feb 7, 2020	DecoderInstance Segmentation	CodeCode Available	1
Depth-Wise Convolutions in Vision Transformers for Efficient Training on Small Datasets	Jul 28, 2024	image-classificationImage Classification	CodeCode Available	1
iBOT: Image BERT Pre-Training with Online Tokenizer	Nov 15, 2021	image-classificationImage Classification	CodeCode Available	1
Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance Segmentation	Aug 13, 2020	ClassificationFew-Shot Object Detection	CodeCode Available	1
FreePoint: Unsupervised Point Cloud Instance Segmentation	May 11, 2023	Instance SegmentationSegmentation	CodeCode Available	1
Implicit Feature Refinement for Instance Segmentation	Dec 9, 2021	Instance SegmentationObject Recognition	CodeCode Available	1
Bi-Directional Attention for Joint Instance and Semantic Segmentation in Point Clouds	Mar 11, 2020	Instance SegmentationMulti-Task Learning	CodeCode Available	1
Detect, consolidate, delineate: scalable mapping of field boundaries using satellite images	Jun 4, 2021	Instance SegmentationSemantic Segmentation	CodeCode Available	1
FsaNet: Frequency Self-attention for Semantic Segmentation	Nov 28, 2022	Instance SegmentationSemantic Segmentation	CodeCode Available	1
Deep Learning based Food Instance Segmentation using Synthetic Data	Jul 15, 2021	Deep LearningInstance Segmentation	CodeCode Available	1
Detection and Segmentation of Lesion Areas in Chest CT Scans For The Prediction of COVID-19	Oct 26, 2020	COVID-19 DiagnosisCOVID-19 Image Segmentation	CodeCode Available	1
Inception Convolution with Efficient Dilation Search	Dec 25, 2020	Human DetectionInstance Segmentation	CodeCode Available	1
Indoor Panorama Planar 3D Reconstruction via Divide and Conquer	Jun 27, 2021	3D ReconstructionInstance Segmentation	CodeCode Available	1
Focal Self-attention for Local-Global Interactions in Vision Transformers	Jul 1, 2021	image-classificationImage Classification	CodeCode Available	1
FinnWoodlands Dataset	Apr 3, 2023	Autonomous DrivingDepth Completion	CodeCode Available	1
Instance As Identity: A Generic Online Paradigm for Video Instance Segmentation	Aug 5, 2022	Instance SegmentationSemantic Segmentation	CodeCode Available	1
Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data Augmentation	Dec 15, 2020	Autonomous DrivingData Augmentation	CodeCode Available	1
FipTR: A Simple yet Effective Transformer Framework for Future Instance Prediction in Autonomous Driving	Apr 19, 2024	Autonomous DrivingInstance Segmentation	CodeCode Available	1
FoodSAM: Any Food Segmentation	Aug 11, 2023	Image SegmentationInstance Segmentation	CodeCode Available	1
DeVIS: Making Deformable Transformers Work for Video Instance Segmentation	Jul 22, 2022	Instance Segmentationobject-detection	CodeCode Available	1
DFormer: Diffusion-guided Transformer for Universal Image Segmentation	Jun 6, 2023	DecoderDenoising	CodeCode Available	1
Fully Automated Scan-to-BIM Via Point Cloud Instance Segmentation	Sep 11, 2023	3D Instance Segmentation3D Semantic Segmentation	CodeCode Available	1
Deep learning approaches to building rooftop thermal bridge detection from aerial images	Dec 12, 2022	Instance SegmentationObject Detection	CodeCode Available	1
BlockCopy: High-Resolution Video Processing with Block-Sparse Feature Propagation and Online Policies	Aug 20, 2021	Instance SegmentationPedestrian Detection	CodeCode Available	1
DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition	Feb 3, 2023	Instance Segmentationobject-detection	CodeCode Available	1
FcaNet: Frequency Channel Attention Networks	Dec 22, 2020	image-classificationImage Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 12 of 46Next →

All datasets COCO test-dev COCO minival LVIS v1.0 val Cityscapes val ADE20K val ARMBench Occluded COCO OoDIS Separated COCO TBBR BDD100K val COCO val (panoptic labels)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H	AP50	80.8	—	Unverified
2	ResNeSt-200 (multi-scale)	AP50	70.2	—	Unverified
3	CenterMask + VoVNetV2-99 (multi-scale)	AP50	66.2	—	Unverified
4	CenterMask + VoVNetV2-57 (single-scale)	AP50	60.8	—	Unverified
5	Co-DETR	mask AP	57.1	—	Unverified
6	CBNetV2 (EVA02, single-scale)	mask AP	56.1	—	Unverified
7	ISDA (ResNet-50)	APL	55.7	—	Unverified
8	EVA	mask AP	55.5	—	Unverified
9	FD-SwinV2-G	mask AP	55.4	—	Unverified
10	Mask Frozen-DETR	mask AP	55.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InternImage-B	GFLOPs	501	—	Unverified
2	Co-DETR	mask AP	56.6	—	Unverified
3	ViT-CoMer-L (Mask RCNN, DINOv2)	mask AP	55.9	—	Unverified
4	InternImage-H	mask AP	55.4	—	Unverified
5	EVA	mask AP	55	—	Unverified
6	Mask Frozen-DETR	mask AP	54.9	—	Unverified
7	MasK DINO (SwinL, multi-scale)	mask AP	54.5	—	Unverified
8	GLEE-Pro	mask AP	54.2	—	Unverified
9	ViT-Adapter-L (HTC++, BEiTv2, O365, multi-scale)	mask AP	54.2	—	Unverified
10	SwinV2-G (HTC++)	mask AP	53.7	—	Unverified