Panoptic Segmentation

Panoptic Segmentation is a computer vision task that combines semantic segmentation and instance segmentation to provide a comprehensive understanding of the scene. The goal of panoptic segmentation is to segment the image into semantically meaningful parts or regions, while also detecting and distinguishing individual instances of objects within those regions. In a given image, every pixel is assigned a semantic label, and pixels belonging to "things" classes (countable objects with instances, like cars and people) are assigned unique instance IDs. ( Image credit: Detectron2 )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 462 papers

Title	Date	Tasks	Status
SANPO: A Scene Understanding, Accessibility and Human Navigation Dataset	Sep 21, 2023	Autonomous VehiclesDepth Estimation	—Unverified
PAg-NeRF: Towards fast and efficient end-to-end panoptic 3D representations for agricultural robotics	Sep 11, 2023	3D ReconstructionCamera Localization	—Unverified
Mask2Anomaly: Mask Transformer for Universal Open-set Segmentation	Sep 8, 2023	Anomaly SegmentationAutonomous Driving	—Unverified
SportsSloMo: A New Benchmark and Baselines for Human-centric Video Frame Interpolation	Aug 31, 2023	Panoptic SegmentationVideo Frame Interpolation	—Unverified
Syn-Mediverse: A Multimodal Synthetic Dataset for Intelligent Scene Understanding of Healthcare Facilities	Aug 6, 2023	Depth EstimationInstance Segmentation	—Unverified
Lowis3D: Language-Driven Open-World Instance-Level 3D Scene Understanding	Aug 1, 2023	3D geometry3D Open-Vocabulary Instance Segmentation	—Unverified
3D detection of roof sections from a single satellite image and application to LOD2-building reconstruction	Jul 11, 2023	3D ReconstructionPanoptic Segmentation	—Unverified
Test-Time Training on Video Streams	Jul 11, 2023	Image ReconstructionPanoptic Segmentation	—Unverified
ReMaX: Relaxing for Better Training on Efficient Panoptic Segmentation	Jun 29, 2023	Panoptic SegmentationSegmentation	—Unverified
Improving Panoptic Segmentation for Nighttime or Low-Illumination Urban Driving Scenes	Jun 23, 2023	Autonomous VehiclesPanoptic Segmentation	CodeCode Available
3rd Place Solution for PVUW Challenge 2023: Video Panoptic Segmentation	Jun 11, 2023	Instance SegmentationPanoptic Segmentation	—Unverified
SimpSON: Simplifying Photo Cleanup with Single-Click Distracting Object Segmentation Network	May 28, 2023	Panoptic SegmentationSegmentation	CodeCode Available
Asynchronous Events-based Panoptic Segmentation using Graph Mixer Neural Network	May 5, 2023	Panoptic SegmentationRobotic Grasping	CodeCode Available
Ensembling Instance and Semantic Segmentation for Panoptic Segmentation	Apr 20, 2023	Instance SegmentationPanoptic Segmentation	—Unverified
ProPanDL: A Modular Architecture for Uncertainty-Aware Panoptic Segmentation	Apr 17, 2023	Panoptic Segmentationscoring rule	—Unverified
Intra-Batch Supervision for Panoptic Segmentation on High-Resolution Images	Apr 17, 2023	Panoptic Segmentation	CodeCode Available
Video-kMaX: A Simple Unified Approach for Online and Near-Online Video Panoptic Segmentation	Apr 10, 2023	Panoptic SegmentationScene Understanding	—Unverified
Uncertainty estimation in Deep Learning for Panoptic segmentation	Apr 4, 2023	Deep Learningimage-classification	—Unverified
FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation	Mar 30, 2023	Image SegmentationInstance Segmentation	—Unverified
4D Panoptic Segmentation as Invariant and Equivariant Field Prediction	Mar 28, 2023	4D Panoptic SegmentationAutonomous Driving	—Unverified
Open-vocabulary Panoptic Segmentation with Embedding Modulation	Mar 20, 2023	Image SegmentationOpen Vocabulary Panoptic Segmentation	—Unverified
Towards Universal Vision-language Omni-supervised Segmentation	Mar 12, 2023	Instance Segmentationobject-detection	—Unverified
Rethinking Range View Representation for LiDAR Segmentation	Mar 9, 2023	3D Semantic SegmentationAutonomous Driving	—Unverified
Nerflets: Local Radiance Fields for Efficient Structure-Aware 3D Scene Representation from 2D Supervision	Mar 6, 2023	3D Panoptic SegmentationPanoptic Segmentation	—Unverified
Deep Learning Based Dominant Index Lesion Segmentation for MR-guided Radiation Therapy of Prostate Cancer	Mar 6, 2023	Lesion SegmentationPanoptic Segmentation	—Unverified
Unified Perception: Efficient Depth-Aware Video Panoptic Segmentation with Minimal Annotation Costs	Mar 3, 2023	Depth-aware Video Panoptic SegmentationPanoptic Segmentation	—Unverified
LMSeg: Language-guided Multi-dataset Segmentation	Feb 27, 2023	Image AugmentationPanoptic Segmentation	—Unverified
Tuning computer vision models with task rewards	Feb 16, 2023	ColorizationImage Captioning	—Unverified
PUPS: Point Cloud Unified Panoptic Segmentation	Feb 13, 2023	DecoderInstance Segmentation	—Unverified
On the Ideal Number of Groups for Isometric Gradient Propagation	Feb 7, 2023	Fine-Grained Image ClassificationImage Classification	—Unverified
AOP-Net: All-in-One Perception Network for Joint LiDAR-based 3D Object Detection and Panoptic Segmentation	Feb 2, 2023	3D Object DetectionAll	—Unverified
Panoptic Compositional Feature Field for Editable Scene Rendering With Network-Inferred Labels via Metric Learning	Jan 1, 2023	2D Panoptic SegmentationMetric Learning	—Unverified
SegGPT: Towards Segmenting Everything in Context	Jan 1, 2023	Few-Shot Semantic SegmentationIn-Context Learning	—Unverified
Connectivity-constrained Interactive Panoptic Segmentation	Dec 13, 2022	Panoptic SegmentationSegmentation	—Unverified
CoMFormer: Continual Learning in Semantic and Panoptic Segmentation	Nov 25, 2022	Continual LearningContinual Panoptic Segmentation	—Unverified
Dual Complementary Dynamic Convolution for Image Recognition	Nov 11, 2022	image-classificationImage Classification	—Unverified
MonoDVPS: A Self-Supervised Monocular Depth Estimation Approach to Depth-aware Video Panoptic Segmentation	Oct 14, 2022	Depth-aware Video Panoptic SegmentationDepth Estimation	—Unverified
A Generalist Framework for Panoptic Segmentation of Images and Videos	Oct 12, 2022	Inductive BiasPanoptic Segmentation	—Unverified
Uncertainty-aware LiDAR Panoptic Segmentation	Oct 10, 2022	Autonomous DrivingPanoptic Segmentation	CodeCode Available
Time-Space Transformers for Video Panoptic Segmentation	Oct 7, 2022	Instance SegmentationPanoptic Segmentation	—Unverified
LidarMultiNet: Towards a Unified Multi-Task Network for LiDAR Perception	Sep 19, 2022	3D Object Detection3D Semantic Segmentation	—Unverified
Self-supervised Learning for Panoptic Segmentation of Multiple Fruit Flower Species	Sep 10, 2022	Data AugmentationInstance Segmentation	CodeCode Available
SUNet: Scale-aware Unified Network for Panoptic Segmentation	Sep 7, 2022	Instance SegmentationPanoptic Segmentation	—Unverified
Dual Decision Improves Open-Set Panoptic Segmentation	Jul 6, 2022	Panoptic Segmentation	—Unverified
A Survey on Label-efficient Deep Image Segmentation: Bridging the Gap between Weak Supervision and Dense Prediction	Jul 4, 2022	Image SegmentationInstance Segmentation	—Unverified
UniDAformer: Unified Domain Adaptive Panoptic Segmentation Transformer via Hierarchical Mask Calibration	Jun 30, 2022	Domain AdaptationInstance Segmentation	—Unverified
MaskRange: A Mask-classification Model for Range-view based LiDAR Segmentation	Jun 24, 2022	ClassificationData Augmentation	—Unverified
LidarMultiNet: Unifying LiDAR Semantic Segmentation, 3D Object Detection, and Panoptic Segmentation in a Single Multi-task Network	Jun 23, 2022	3D Object Detection3D Semantic Segmentation	—Unverified
Waymo Open Dataset: Panoramic Video Panoptic Segmentation	Jun 15, 2022	3D Multi-Object TrackingAutonomous Driving	—Unverified
TubeFormer-DeepLab: Video Mask Transformer	May 30, 2022	Panoptic SegmentationSegmentation	—Unverified

Show:10 25 50

← PrevPage 7 of 10Next →

All datasets COCO test-dev Cityscapes val COCO minival ADE20K val Mapillary val Cityscapes test LaRS S3DIS Area5 ScanNetV2 Indian Driving Dataset KITTI Panoptic Segmentation PanNuke

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Mask DINO (single scale)	PQ	59.5	—	Unverified
2	kMaX-DeepLab (single-scale)	PQ	58.5	—	Unverified
3	Mask2Former (Swin-L)	PQ	58.3	—	Unverified
4	Panoptic SegFormer (Swin-L)	PQ	56.2	—	Unverified
5	Panoptic SegFormer (PVTv2-B5)	PQ	55.8	—	Unverified
6	CMT-DeepLab (single-scale)	PQ	55.7	—	Unverified
7	K-Net (Swin-L)	PQ	55.2	—	Unverified
8	MaskConver (ResNet50, single-scale)	PQ	53.6	—	Unverified
9	MaskFormer (Swin-L)	PQ	53.3	—	Unverified
10	Panoptic FCN* (Swin-L)	PQ	52.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViT-P (OneFormer, InternImage-H)	PQ	70.8	—	Unverified
2	Panoptic FCN* (Swin-L, Cityscapes-fine)	PQst	70.6	—	Unverified
3	OneFormer (ConvNeXt-L, single-scale, 512x1024, Mapillary Vistas-pretrained)	PQ	70.1	—	Unverified
4	Panoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary Vistas, multi-scale)	PQ	69.6	—	Unverified
5	OneFormer (ConvNeXt-L, single-scale)	PQ	68.51	—	Unverified
6	Panoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary Vistas, single-scale)	PQ	68.5	—	Unverified
7	Axial-DeepLab-XL (Mapillary Vistas, multi-scale)	PQ	68.5	—	Unverified
8	kMaX-DeepLab (single-scale)	PQ	68.4	—	Unverified
9	OneFormer (ConvNeXt-XL, single-scale)	PQ	68.4	—	Unverified
10	AFF-Base (single-scale, point-based Mask2Former)	PQ	67.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HyperSeg (Swin-B)	PQ	61.2	—	Unverified
2	OneFormer (InternImage-H,single-scale)	PQ	60	—	Unverified
3	OpenSeeD (SwinL, single-scale)	PQ	59.5	—	Unverified
4	UMG-CLIP-E/14	PQ	59.5	—	Unverified
5	MasK DINO (SwinL,single-scale)	PQ	59.4	—	Unverified
6	EoMT (DINOv2-g, single-scale, 1280x1280)	PQ	59.2	—	Unverified
7	UMG-CLIP-L/14	PQ	58.9	—	Unverified
8	Panoptic FCN* (Swin-L, single-scale)	PQth	58.5	—	Unverified
9	DiNAT-L (single-scale, Mask2Former)	PQ	58.5	—	Unverified
10	ViT-Adapter-L (single-scale, BEiTv2 pretrain, Mask2Former)	PQ	58.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OneFormer (InternImage-H, emb_dim=256, single-scale, 896x896)	PQ	54.5	—	Unverified
2	ViT-P (OneFormer, DiNAT-L, single-scale, 1280x1280, COCO_pretrain)	PQ	54	—	Unverified
3	OpenSeed(SwinL, single scale, 1280x1280)	PQ	53.7	—	Unverified
4	OneFormer (DiNAT-L, single-scale, 1280x1280, COCO-Pretrain)	PQ	53.4	—	Unverified
5	EoMT (DINOv2-g, single-scale, 1280x1280, COCO pre-trained)	PQ	52.8	—	Unverified
6	X-Decoder (Davit-d5, Deform, single-scale, 1280x1280)	PQ	52.4	—	Unverified
7	ViT-P (OneFormer, DiNAT-L, single-scale, 1280x1280)	PQ	51.9	—	Unverified
8	OneFormer (DiNAT-L, single-scale, 1280x1280)	PQ	51.5	—	Unverified
9	OneFormer (Swin-L, single-scale, 1280x1280)	PQ	51.4	—	Unverified
10	kMaX-DeepLab (ConvNeXt-L, single-scale, 1281x1281)	PQ	50.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OneFormer (DiNAT-L, single-scale)	PQ	46.7	—	Unverified
2	OneFormer (ConvNeXt-L, single-scale)	PQ	46.4	—	Unverified
3	Panoptic FCN* (Swin-L, single-scale)	PQ	45.7	—	Unverified
4	Panoptic-DeepLab (SWideRNet-(1, 1, 4.5), multi-scale)	PQ	44.8	—	Unverified
5	Panoptic FCN* (ResNet-50-FPN)	PQst	42.3	—	Unverified
6	Mask2Former + Intra-Batch Supervision (ResNet-50)	PQ	42.2	—	Unverified
7	Axial-DeepLab-L (multi-scale)	PQ	41.1	—	Unverified
8	EfficientPS	PQ	40.6	—	Unverified
9	Panoptic-DeepLab (X71)	PQ	40.5	—	Unverified
10	AdaptIS (ResNeXt-101)	PQ	40.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OneFormer (ConvNeXt-L, single-scale, Mapillary Vistas-Pretrained)	PQ	68	—	Unverified
2	Panoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary, multi-scale)	PQ	67.8	—	Unverified
3	EfficientPS	PQ	67.1	—	Unverified
4	Axial-DeepLab-XL (Mapillary Vistas, multi-scale)	PQ	66.6	—	Unverified
5	kMaX-DeepLab (single-scale)	PQ	66.2	—	Unverified
6	Panoptic-Deeplab	PQ	65.5	—	Unverified
7	EfficientPS (Cityscapes-fine)	PQ	62.9	—	Unverified
8	COPS (ResNet-50)	PQ	60	—	Unverified
9	SOGNet (ResNet-50)	PQ	60	—	Unverified
10	Dynamically Instantiated Network	PQ	55.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mask2Former (Swin-B)	PQ	41.7	—	Unverified
2	Panoptic FPN (ResNet-50)	PQ	40.1	—	Unverified
3	Mask2Former (Swin-T)	PQ	39.2	—	Unverified
4	Panoptic FPN (ResNet-101)	PQ	38.7	—	Unverified
5	Mask2Former (ResNet-50)	PQ	37.6	—	Unverified
6	Mask2Former (ResNet-101)	PQ	37.2	—	Unverified
7	Panoptic Deeplab (ResNet-50)	PQ	34.7	—	Unverified
8	MaX-DeepLab	PQ	31.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SuperCluster	PQ	50.1	—	Unverified
2	PointGroup (Xiang 2023)	PQ	42.3	—	Unverified
3	KPConv (Xiang 2023)	PQ	41.8	—	Unverified
4	MinkowskiNet (Xiang 2023)	PQ	39.2	—	Unverified
5	PointNet++ (Xiang 2023)	PQ	24.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OneFormer3D	PQ	71.2	—	Unverified
2	PanopticNDT (10cm)	PQ	59.19	—	Unverified
3	SuperCluster	PQ	58.7	—	Unverified
4	PanopticFusion (with CRF)	PQ	33.5	—	Unverified
5	SceneGraphFusion (NN mapping)	PQ	31.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EfficientPS	PQ	51.1	—	Unverified
2	Seamless	PQ	48.5	—	Unverified
3	UPSNet	PQ	47.1	—	Unverified
4	Panoptic FPN	PQ	46.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EfficientPS	PQ	43.7	—	Unverified
2	Seamless	PQ	42.2	—	Unverified
3	UPSNet	PQ	39.9	—	Unverified
4	Panoptic FPN	PQ	39.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LKCell	PQ	50.8	—	Unverified
2	CellViT-SAM-H	PQ	50.62	—	Unverified
3	TSFD	PQ	50.4	—	Unverified
4	NuLite-H	PQ	49.81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OneFormer3D	PQ	71.2	—	Unverified
2	SuperCluster	PQ	58.7	—	Unverified
3	PanopticFusion	PQ	33.5	—	Unverified
4	SceneGraphFusion	PQ	31.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Exchanger+Mask2Former	PQ	52.6	—	Unverified
2	Exchanger+Unet+PaPs	PQ	47.8	—	Unverified
3	U-TAE + PaPs	PQ	40.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VAN-B6*	PQ	58.2	—	Unverified
2	PFPN (ideal number of groups)	PQ	42.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CAFuser (Swin-T)	PQ	59.7	—	Unverified
2	MUSES (Mask2Former /w 4xSwin-T)	PQ	53.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EMSANet (2x ResNet-34 NBt1D, PanopticNDT version, finetuned)	PQ	51.15	—	Unverified
2	EMSANet	PQ	47.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	P3Former	PQ	0.65	—	Unverified
2	DS-Net	PQ	0.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MasQCLIP	PQ	23.3	—	Unverified