Semantic Segmentation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 14763 papers

Title	Date	Tasks	Status	Hype
FDA: Fourier Domain Adaptation for Semantic Segmentation	Apr 11, 2020	Domain AdaptationSegmentation	CodeCode Available	3
Merlin: A Vision Language Foundation Model for 3D Computed Tomography	Jun 10, 2024	3D Semantic SegmentationComputed Tomography (CT)	CodeCode Available	3
Generalized Decoding for Pixel, Image, and Language	Dec 21, 2022	DecoderImage Segmentation	CodeCode Available	3
MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining	Mar 20, 2024	Aerial Scene ClassificationBuilding change detection for remote sensing images	CodeCode Available	3
Exploring Regional Clues in CLIP for Zero-Shot Semantic Segmentation	Jan 1, 2024	SegmentationSemantic Segmentation	CodeCode Available	3
EMCAD: Efficient Multi-scale Convolutional Attention Decoding for Medical Image Segmentation	May 11, 2024	Computational EfficiencyDecoder	CodeCode Available	3
Nuclei instance segmentation and classification in histopathology images with StarDist	Mar 3, 2022	ClassificationInstance Segmentation	CodeCode Available	3
Anything-3D: Towards Single-view Anything Reconstruction in the Wild	Apr 19, 2023	3D ReconstructionDiversity	CodeCode Available	3
5%>100%: Breaking Performance Shackles of Full Fine-Tuning on Visual Recognition Tasks	Aug 15, 2024	image-classificationImage Classification	CodeCode Available	3
FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization	Mar 24, 2023	3D Hand Pose EstimationGPU	CodeCode Available	3
Personalize Segment Anything Model with One Shot	May 4, 2023	Image Generationmodel	CodeCode Available	3
PlainMamba: Improving Non-Hierarchical Mamba in Visual Recognition	Mar 26, 2024	Image ClassificationInstance Segmentation	CodeCode Available	3
Point Transformer V3: Simpler, Faster, Stronger	Dec 15, 2023	3D Semantic SegmentationLIDAR Semantic Segmentation	CodeCode Available	3
PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model	Mar 21, 2024	DecoderGeneralized Referring Expression Segmentation	CodeCode Available	3
Generalized Robot 3D Vision-Language Model with Fast Rendering and Pre-Training Vision-Language Alignment	Dec 1, 2023	Contrastive LearningFew-Shot Learning	CodeCode Available	3
PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360^	Mar 23, 2023	Image GenerationImage Segmentation	CodeCode Available	3
UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface	Mar 3, 2025	Instance SegmentationReasoning Segmentation	CodeCode Available	3
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models	Jan 30, 2025	Action RecognitionDomain Adaptation	CodeCode Available	3
MogaNet: Multi-order Gated Aggregation Network	Nov 7, 2022	3D Human Pose EstimationImage Classification	CodeCode Available	2
Ambiguous Medical Image Segmentation using Diffusion Models	Apr 10, 2023	DiagnosticDiversity	CodeCode Available	2
UNetFormer: A UNet-like Transformer for Efficient Semantic Segmentation of Remote Sensing Urban Scene Imagery	Sep 18, 2021	Change DetectionDecoder	CodeCode Available	2
Efficient Spatial-Temporal Information Fusion for LiDAR-Based 3D Moving Object Segmentation	Jul 5, 2022	Autonomous DrivingCollision Avoidance	CodeCode Available	2
ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer	Mar 8, 2022	Image Classificationobject-detection	CodeCode Available	2
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning	Mar 29, 2024	Continual LearningContinual Panoptic Segmentation	CodeCode Available	2
EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for Mobile Vision Applications	Jun 21, 2022	Image ClassificationObject Detection	CodeCode Available	2
EasyPortrait -- Face Parsing and Portrait Segmentation Dataset	Apr 26, 2023	DiversityDomain Generalization	CodeCode Available	2
Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation	Apr 8, 2025	Domain AdaptationDomain Generalization	CodeCode Available	2
ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks	Oct 8, 2019	Dimensionality Reductionimage-classification	CodeCode Available	2
Efficient 3D Semantic Segmentation with Superpoint Transformer	Jun 13, 2023	3D Semantic SegmentationGPU	CodeCode Available	2
Dynamic Tuning Towards Parameter and Inference Efficiency for ViT Adaptation	Mar 18, 2024	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	2
Alleviating Textual Reliance in Medical Language-guided Segmentation via Prototype-driven Semantic Approximation	Jul 15, 2025	Image SegmentationSegmentation	CodeCode Available	2
DytanVO: Joint Refinement of Visual Odometry and Motion Segmentation in Dynamic Environments	Sep 17, 2022	Motion SegmentationSemantic Segmentation	CodeCode Available	2
DuPL: Dual Student with Trustworthy Progressive Learning for Robust Weakly Supervised Semantic Segmentation	Mar 17, 2024	Semantic SegmentationWeakly supervised Semantic Segmentation	CodeCode Available	2
AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation	Mar 4, 2024	Semantic SegmentationSemi-Supervised Semantic Segmentation	CodeCode Available	2
Dynamic in Static: Hybrid Visual Correspondence for Self-Supervised Video Object Segmentation	Apr 21, 2024	Semantic SegmentationVideo Object Segmentation	CodeCode Available	2
E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation	Mar 8, 2022	GPUInstance Segmentation	CodeCode Available	2
DreamColour: Controllable Video Colour Editing without Training	Dec 6, 2024	Instance SegmentationSemantic Segmentation	CodeCode Available	2
DreamLIP: Language-Image Pre-training with Long Captions	Mar 25, 2024	Contrastive LearningImage-text Retrieval	CodeCode Available	2
Domain Adaptation with a Single Vision-Language Embedding	Oct 28, 2024	Domain AdaptationOne-shot Unsupervised Domain Adaptation	CodeCode Available	2
AllWeatherNet:Unified Image Enhancement for Autonomous Driving under Adverse Weather and Lowlight-conditions	Sep 3, 2024	Autonomous DrivingDeep Attention	CodeCode Available	2
Domain Adaptive and Generalizable Network Architectures and Training Strategies for Semantic Image Segmentation	Apr 26, 2023	Domain AdaptationDomain Generalization	CodeCode Available	2
DSNet: A Novel Way to Use Atrous Convolutions in Semantic Segmentation	Jun 6, 2024	Real-Time Semantic SegmentationSemantic Segmentation	CodeCode Available	2
EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation	Mar 3, 2024	ObjectRepresentation Learning	CodeCode Available	2
Efficient Video Object Segmentation via Modulated Cross-Attention Memory	Mar 26, 2024	GPUObject	CodeCode Available	2
Distribution-Free, Risk-Controlling Prediction Sets	Jan 7, 2021	BIG-bench Machine LearningClassification	CodeCode Available	2
AiTLAS: Artificial Intelligence Toolbox for Earth Observation	Jan 21, 2022	BenchmarkingEarth Observation	CodeCode Available	2
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2
A large annotated medical image dataset for the development and evaluation of segmentation algorithms	Feb 25, 2019	BenchmarkingSegmentation	CodeCode Available	2
1st Place Solution for PSG competition with ECCV'22 SenseHuman Workshop	Feb 6, 2023	Multi-class ClassificationPanoptic Segmentation	CodeCode Available	2
Diversified and Personalized Multi-rater Medical Image Segmentation	Mar 20, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2

Show:10 25 50

← PrevPage 4 of 296Next →

All datasets ADE20K NYU-Depth V2 Cityscapes test Cityscapes val ADE20K val PASCAL Context S3DIS Area5 PASCAL VOC 2012 test S3DIS ScanNet SUN-RGBD DensePASS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H (M3I Pre-training)	Params (M)	1,310	—	Unverified
2	ViT-P (InternImage-H)	Validation mIoU	63.6	—	Unverified
3	ONE-PEACE	Validation mIoU	63	—	Unverified
4	M3I Pre-training (InternImage-H)	Validation mIoU	62.9	—	Unverified
5	InternImage-H	Validation mIoU	62.9	—	Unverified
6	BEiT-3	Validation mIoU	62.8	—	Unverified
7	EVA	Validation mIoU	62.3	—	Unverified
8	ViT-P (OneFormer, InternImage-H)	Validation mIoU	61.6	—	Unverified
9	ViT-Adapter-L (Mask2Former, BEiTv2 pretrain)	Validation mIoU	61.5	—	Unverified
10	FD-SwinV2-G	Validation mIoU	61.4	—	Unverified