Semantic Segmentation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 14763 papers

Title	Date	Tasks	Status	Hype	Score
Diversified and Personalized Multi-rater Medical Image Segmentation	Mar 20, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2	5
Does Image Anonymization Impact Computer Vision Training?	Jun 8, 2023	Face AnonymizationInstance Segmentation	CodeCode Available	2	5
Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields	Dec 6, 2023	3DGS3D scene Editing	CodeCode Available	2	5
Feature Pyramid Networks for Object Detection	Dec 9, 2016	GPUObject	CodeCode Available	2	5
A Unified Transformer Framework for Group-based Segmentation: Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection	Mar 9, 2022	Co-Salient Object Detectionobject-detection	CodeCode Available	2	5
Find First, Track Next: Decoupling Identification and Propagation in Referring Video Object Segmentation	Mar 5, 2025	ObjectReferring Video Object Segmentation	CodeCode Available	2	5
FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models	Feb 7, 2024	Instance SegmentationObject	CodeCode Available	2	5
FocalClick: Towards Practical Interactive Image Segmentation	Apr 6, 2022	Image SegmentationInteractive Segmentation	CodeCode Available	2	5
RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds	Nov 25, 2019	3D Semantic SegmentationLIDAR Semantic Segmentation	CodeCode Available	2	5
Frequency-Adaptive Dilated Convolution for Semantic Segmentation	Mar 8, 2024	object-detectionObject Detection	CodeCode Available	2	5
Frozen CLIP: A Strong Backbone for Weakly Supervised Semantic Segmentation	Jun 17, 2024	DecoderSegmentation	CodeCode Available	2	5
RevSAM2: Prompt SAM2 for Medical Image Segmentation via Reverse-Propagation without Fine-tuning	Sep 6, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2	5
Attention Mechanisms in Computer Vision: A Survey	Nov 15, 2021	image-classificationImage Classification	CodeCode Available	2	5
FusionVision: A comprehensive approach of 3D object reconstruction and segmentation from RGB-D cameras using YOLO and fast segment anything	Feb 29, 2024	3D Object ReconstructionInstance Segmentation	CodeCode Available	2	5
Visible-Thermal Multiple Object Tracking: Large-scale Video Dataset and Progressive Fusion Approach	Aug 2, 2024	cross-modal alignmentMultiple Object Tracking	CodeCode Available	2	5
DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data	May 16, 2024	Data AugmentationDiversity	CodeCode Available	2	5
Domain Adaptation with a Single Vision-Language Embedding	Oct 28, 2024	Domain AdaptationOne-shot Unsupervised Domain Adaptation	CodeCode Available	2	5
Generative Medical Segmentation	Mar 27, 2024	DecoderDomain Generalization	CodeCode Available	2	5
GLaMM: Pixel Grounding Large Multimodal Model	Nov 6, 2023	Conversational Question AnsweringImage Captioning	CodeCode Available	2	5
DuPL: Dual Student with Trustworthy Progressive Learning for Robust Weakly Supervised Semantic Segmentation	Mar 17, 2024	Semantic SegmentationWeakly supervised Semantic Segmentation	CodeCode Available	2	5
Audio-Visual Segmentation with Semantics	Jan 30, 2023	SegmentationSemantic Segmentation	CodeCode Available	2	5
GLUS: Global-Local Reasoning Unified into A Single Large Language Model for Video Segmentation	Apr 10, 2025	Contrastive LearningLanguage Modeling	CodeCode Available	2	5
Golden Cudgel Network for Real-Time Semantic Segmentation	Mar 5, 2025	Real-Time Semantic SegmentationSemantic Segmentation	CodeCode Available	2	5
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2	5
Fast Vision Transformers with HiLo Attention	May 26, 2022	BenchmarkingEfficient ViTs	CodeCode Available	2	5
Hulk: A Universal Knowledge Translator for Human-Centric Tasks	Dec 4, 2023	3D Human Pose EstimationAction Recognition	CodeCode Available	2	5
Hierarchical Multi-Scale Attention for Semantic Segmentation	May 21, 2020	Panoptic SegmentationSemantic Segmentation	CodeCode Available	2	5
Augmented Object Intelligence with XR-Objects	Apr 20, 2024	ObjectSemantic Segmentation	CodeCode Available	2	5
AgileFormer: Spatially Agile Transformer UNet for Medical Image Segmentation	Mar 29, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2	5
A Unified Framework for 3D Scene Understanding	Jul 3, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available	2	5
HiMTok: Learning Hierarchical Mask Tokens for Image Segmentation with Large Multimodal Model	Mar 17, 2025	Image SegmentationSegmentation	CodeCode Available	2	5
Hier-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting	Sep 19, 2024	Scene UnderstandingSemantic Segmentation	CodeCode Available	2	5
Diffusion models as plug-and-play priors	Jun 17, 2022	Combinatorial OptimizationDenoising	CodeCode Available	2	5
Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure	Sep 4, 2024	Crack SegmentationDecoder	CodeCode Available	2	5
Hypersim: A Photorealistic Synthetic Dataset for Holistic Indoor Scene Understanding	Nov 4, 2020	Multi-Task LearningScene Understanding	CodeCode Available	2	5
IDRNet: Intervention-Driven Relation Network for Semantic Segmentation	Oct 16, 2023	RelationRelation Network	CodeCode Available	2	5
Digital Twin Generation from Visual Data: A Survey	Apr 17, 2025	Semantic SegmentationSurvey	CodeCode Available	2	5
Image Segmentation in Foundation Model Era: A Survey	Aug 23, 2024	Image SegmentationInstance Segmentation	CodeCode Available	2	5
DiffRect: Latent Diffusion Label Rectification for Semi-supervised Medical Image Segmentation	Jul 13, 2024	DenoisingImage Segmentation	CodeCode Available	2	5
AiTLAS: Artificial Intelligence Toolbox for Earth Observation	Jan 21, 2022	BenchmarkingEarth Observation	CodeCode Available	2	5
DiffBEV: Conditional Diffusion Model for Bird's Eye View Perception	Mar 15, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	2	5
Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion	Aug 23, 2023	SegmentationSemantic Segmentation	CodeCode Available	2	5
A large annotated medical image dataset for the development and evaluation of segmentation algorithms	Feb 25, 2019	BenchmarkingSegmentation	CodeCode Available	2	5
Dilated Neighborhood Attention Transformer	Sep 29, 2022	Image ClassificationInstance Segmentation	CodeCode Available	2	5
DFormer: Rethinking RGBD Representation Learning for Semantic Segmentation	Sep 18, 2023	3D geometryDecoder	CodeCode Available	2	5
DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution	Jun 3, 2020	Instance SegmentationObject	CodeCode Available	2	5
Interlaced Sparse Self-Attention for Semantic Segmentation	Jul 29, 2019	SegmentationSemantic Segmentation	CodeCode Available	2	5
DiffAtlas: GenAI-fying Atlas Segmentation via Image-Mask Diffusion	Mar 9, 2025	Image SegmentationMedical Image Segmentation	CodeCode Available	2	5
DI-MaskDINO: A Joint Object Detection and Instance Segmentation Model	Oct 22, 2024	DecoderInstance Segmentation	CodeCode Available	2	5
Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation	Jan 15, 2025	Image SegmentationReferring Expression Segmentation	CodeCode Available	2	5

Show:10 25 50

← PrevPage 8 of 296Next →

All datasets ADE20K NYU-Depth V2 Cityscapes test Cityscapes val ADE20K val PASCAL Context S3DIS Area5 PASCAL VOC 2012 test S3DIS ScanNet SUN-RGBD DensePASS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H (M3I Pre-training)	Params (M)	1,310	—	Unverified
2	ViT-P (InternImage-H)	Validation mIoU	63.6	—	Unverified
3	ONE-PEACE	Validation mIoU	63	—	Unverified
4	M3I Pre-training (InternImage-H)	Validation mIoU	62.9	—	Unverified
5	InternImage-H	Validation mIoU	62.9	—	Unverified
6	BEiT-3	Validation mIoU	62.8	—	Unverified
7	EVA	Validation mIoU	62.3	—	Unverified
8	ViT-P (OneFormer, InternImage-H)	Validation mIoU	61.6	—	Unverified
9	ViT-Adapter-L (Mask2Former, BEiTv2 pretrain)	Validation mIoU	61.5	—	Unverified
10	FD-SwinV2-G	Validation mIoU	61.4	—	Unverified