Semantic Segmentation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 626–650 of 14763 papers

Title	Date	Tasks	Status	Hype	Score
DAT++: Spatially Dynamic Vision Transformer with Deformable Attention	Sep 4, 2023	Image ClassificationInstance Segmentation	CodeCode Available	2	5
Advancing Plain Vision Transformer Towards Remote Sensing Foundation Model	Aug 8, 2022	Aerial Scene ClassificationFew-Shot Learning	CodeCode Available	2	5
DDP: Diffusion Model for Dense Visual Prediction	Mar 30, 2023	DenoisingDepth Estimation	CodeCode Available	2	5
DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models	Aug 11, 2023	Dataset GenerationDecoder	CodeCode Available	2	5
InvPT: Inverted Pyramid Multi-task Transformer for Dense Scene Understanding	Mar 15, 2022	Boundary DetectionHuman Parsing	CodeCode Available	2	5
Label Anything: Multi-Class Few-Shot Semantic Segmentation with Visual Prompts	Jul 2, 2024	Few-Shot Semantic SegmentationSemantic Segmentation	CodeCode Available	2	5
Label Efficient Visual Abstractions for Autonomous Driving	May 20, 2020	Autonomous DrivingSegmentation	CodeCode Available	2	5
Dataset Quantization	Aug 21, 2023	Dataset Distillationobject-detection	CodeCode Available	2	5
An Empirical Study of Remote Sensing Pretraining	Apr 6, 2022	Aerial Scene ClassificationBuilding change detection for remote sensing images	CodeCode Available	2	5
Language-driven Semantic Segmentation	Jan 10, 2022	DescriptiveFew-Shot Semantic Segmentation	CodeCode Available	2	5
An End-to-End Robust Point Cloud Semantic Segmentation Network with Single-Step Conditional Diffusion Models	Nov 25, 2024	DenoisingScene Understanding	CodeCode Available	2	5
LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation	Mar 12, 2024	Image SegmentationLong-range modeling	CodeCode Available	2	5
LaSagnA: Language-based Segmentation Assistant for Complex Queries	Apr 12, 2024	SegmentationSemantic Segmentation	CodeCode Available	2	5
Visible-Thermal Multiple Object Tracking: Large-scale Video Dataset and Progressive Fusion Approach	Aug 2, 2024	cross-modal alignmentMultiple Object Tracking	CodeCode Available	2	5
MobileOne: An Improved One millisecond Mobile Backbone	Jun 8, 2022	Efficient Neural NetworkGaze Estimation	CodeCode Available	2	5
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale	Oct 22, 2020	image-classificationSemantic Segmentation	CodeCode Available	2	5
Learning What Not to Segment: A New Perspective on Few-Shot Segmentation	Mar 15, 2022	Few-Shot Semantic SegmentationMeta-Learning	CodeCode Available	2	5
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception	May 7, 2025	object-detectionObject Detection	CodeCode Available	2	5
LHU-Net: A Light Hybrid U-Net for Cost-Efficient, High-Performance Volumetric Medical Image Segmentation	Apr 7, 2024	Computational EfficiencyImage Segmentation	CodeCode Available	2	5
DiffAtlas: GenAI-fying Atlas Segmentation via Image-Mask Diffusion	Mar 9, 2025	Image SegmentationMedical Image Segmentation	CodeCode Available	2	5
Adversarial Supervision Makes Layout-to-Image Diffusion Models Thrive	Jan 16, 2024	Domain GeneralizationImage Generation	CodeCode Available	2	5
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes	Jul 16, 2024	Human Instance SegmentationInstance Segmentation	CodeCode Available	2	5
Cross Language Image Matching for Weakly Supervised Semantic Segmentation	Mar 5, 2022	ObjectSemantic Segmentation	CodeCode Available	2	5
LuSNAR:A Lunar Segmentation, Navigation and Reconstruction Dataset based on Muti-sensor for Autonomous Exploration	Jul 9, 2024	3D ReconstructionAutonomous Navigation	CodeCode Available	2	5
Cross-Modal Interactive Perception Network with Mamba for Lung Tumor Segmentation in PET-CT Images	Mar 21, 2025	Image SegmentationMamba	CodeCode Available	2	5

Show:10 25 50

← PrevPage 26 of 591Next →

All datasets ADE20K NYU-Depth V2 Cityscapes test Cityscapes val ADE20K val PASCAL Context S3DIS Area5 PASCAL VOC 2012 test S3DIS ScanNet SUN-RGBD DensePASS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H (M3I Pre-training)	Params (M)	1,310	—	Unverified
2	ViT-P (InternImage-H)	Validation mIoU	63.6	—	Unverified
3	ONE-PEACE	Validation mIoU	63	—	Unverified
4	M3I Pre-training (InternImage-H)	Validation mIoU	62.9	—	Unverified
5	InternImage-H	Validation mIoU	62.9	—	Unverified
6	BEiT-3	Validation mIoU	62.8	—	Unverified
7	EVA	Validation mIoU	62.3	—	Unverified
8	ViT-P (OneFormer, InternImage-H)	Validation mIoU	61.6	—	Unverified
9	ViT-Adapter-L (Mask2Former, BEiTv2 pretrain)	Validation mIoU	61.5	—	Unverified
10	FD-SwinV2-G	Validation mIoU	61.4	—	Unverified