Semantic Segmentation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 14763 papers

Title	Date	Tasks	Status	Hype
ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding	Oct 17, 2024	3D Semantic SegmentationImage Generation	CodeCode Available	2
WeatherDG: LLM-assisted Diffusion Model for Procedural Weather Generation in Domain-Generalized Semantic Segmentation	Oct 15, 2024	Autonomous DrivingLanguage Modeling	CodeCode Available	2
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity	Oct 14, 2024	DenoisingDichotomous Image Segmentation	CodeCode Available	2
Locality Alignment Improves Vision-Language Models	Oct 14, 2024	Semantic SegmentationSpatial Reasoning	CodeCode Available	2
Text4Seg: Reimagining Image Segmentation as Text Generation	Oct 13, 2024	Image SegmentationReferring Expression	CodeCode Available	2
Towards Natural Image Matting in the Wild via Real-Scenario Prior	Oct 9, 2024	DecoderImage Matting	CodeCode Available	2
MedUniSeg: 2D and 3D Medical Image Segmentation via a Prompt-driven Universal Model	Oct 8, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2
A Simple Image Segmentation Framework via In-Context Examples	Oct 7, 2024	DecoderImage Segmentation	CodeCode Available	2
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos	Sep 29, 2024	AllImage Segmentation	CodeCode Available	2
MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation	Sep 28, 2024	Image SegmentationMedical Image Analysis	CodeCode Available	2
Revisit Anything: Visual Place Recognition via Image Segment Retrieval	Sep 26, 2024	Image SegmentationNavigate	CodeCode Available	2
EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation	Sep 26, 2024	Image SegmentationMamba	CodeCode Available	2
Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation	Sep 24, 2024	DiversityInstance Segmentation	CodeCode Available	2
PointSAM: Pointly-Supervised Segment Anything Model for Remote Sensing Images	Sep 20, 2024	Image SegmentationSemantic Segmentation	CodeCode Available	2
Hier-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting	Sep 19, 2024	Scene UnderstandingSemantic Segmentation	CodeCode Available	2
One missing piece in Vision and Language: A Survey on Comics Understanding	Sep 14, 2024	document understandingimage-classification	CodeCode Available	2
RevSAM2: Prompt SAM2 for Medical Image Segmentation via Reverse-Propagation without Fine-tuning	Sep 6, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2
PlantSeg: A Large-Scale In-the-wild Dataset for Plant Disease Segmentation	Sep 6, 2024	Benchmarkingimage-classification	CodeCode Available	2
Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure	Sep 4, 2024	Crack SegmentationDecoder	CodeCode Available	2
MobileUNETR: A Lightweight End-To-End Hybrid Vision Transformer For Efficient Medical Image Segmentation	Sep 4, 2024	Image SegmentationLesion Segmentation	CodeCode Available	2
AllWeatherNet:Unified Image Enhancement for Autonomous Driving under Adverse Weather and Lowlight-conditions	Sep 3, 2024	Autonomous DrivingDeep Attention	CodeCode Available	2
Generative AI Enables Medical Image Segmentation in Ultra Low-Data Regimes	Aug 30, 2024	Deep LearningImage Segmentation	CodeCode Available	2
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation	Aug 28, 2024	ObjectSemantic Segmentation	CodeCode Available	2
MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation	Aug 25, 2024	Image SegmentationMamba	CodeCode Available	2
TripleMixer: A 3D Point Cloud Denoising Model for Adverse Weather	Aug 25, 2024	Autonomous DrivingDenoising	CodeCode Available	2
Image Segmentation in Foundation Model Era: A Survey	Aug 23, 2024	Image SegmentationInstance Segmentation	CodeCode Available	2
HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation	Aug 21, 2024	Image SegmentationMamba	CodeCode Available	2
UNetMamba: An Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images	Aug 21, 2024	MambaSegmentation	CodeCode Available	2
MedTsLLM: Leveraging LLMs for Multimodal Medical Time Series Analysis	Aug 14, 2024	Anomaly DetectionBoundary Detection	CodeCode Available	2
Robust Semi-supervised Multimodal Medical Image Segmentation via Cross Modality Collaboration	Aug 14, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2
ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation	Aug 13, 2024	SegmentationSemantic Segmentation	CodeCode Available	2
In Defense of Lazy Visual Grounding for Open-Vocabulary Semantic Segmentation	Aug 9, 2024	Image to textObject	CodeCode Available	2
ProxyCLIP: Proxy Attention Improves CLIP for Open-Vocabulary Segmentation	Aug 9, 2024	Open Vocabulary Semantic SegmentationOpen-Vocabulary Semantic Segmentation	CodeCode Available	2
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications	Aug 7, 2024	image-classificationImage Classification	CodeCode Available	2
DaCapo: a modular deep learning framework for scalable 3D image segmentation	Aug 5, 2024	Image SegmentationManagement	CodeCode Available	2
StitchFusion: Weaving Any Visual Modalities to Enhance Multimodal Semantic Segmentation	Aug 2, 2024	SegmentationSemantic Segmentation	CodeCode Available	2
Visible-Thermal Multiple Object Tracking: Large-scale Video Dataset and Progressive Fusion Approach	Aug 2, 2024	cross-modal alignmentMultiple Object Tracking	CodeCode Available	2
Collaborative Vision-Text Representation Optimizing for Open-Vocabulary Segmentation	Aug 1, 2024	Open Vocabulary Panoptic SegmentationOpen Vocabulary Semantic Segmentation	CodeCode Available	2
MSA^2Net: Multi-scale Adaptive Attention-guided Network for Medical Image Segmentation	Jul 31, 2024	DecoderImage Segmentation	CodeCode Available	2
RefMask3D: Language-Guided Transformer for 3D Referring Segmentation	Jul 25, 2024	3D visual groundingImage Segmentation	CodeCode Available	2
ESP-MedSAM: Efficient Self-Prompting SAM for Universal Domain-Generalized Medical Image Segmentation	Jul 19, 2024	DecoderImage Segmentation	CodeCode Available	2
GroupMamba: Efficient Group-Based Visual State Space Model	Jul 18, 2024	image-classificationImage Classification	CodeCode Available	2
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes	Jul 16, 2024	Human Instance SegmentationInstance Segmentation	CodeCode Available	2
SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds	Jul 16, 2024	LIDAR Semantic SegmentationSemantic Segmentation	CodeCode Available	2
DiffRect: Latent Diffusion Label Rectification for Semi-supervised Medical Image Segmentation	Jul 13, 2024	DenoisingImage Segmentation	CodeCode Available	2
IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection	Jul 10, 2024	DecoderImage Segmentation	CodeCode Available	2
Satellite Image Time Series Semantic Change Detection: Novel Architecture and Analysis of Domain Shift	Jul 10, 2024	Change DetectionDisaster Response	CodeCode Available	2
Exploiting Scale-Variant Attention for Segmenting Small Medical Objects	Jul 10, 2024	Cell SegmentationMRI segmentation	CodeCode Available	2
LuSNAR:A Lunar Segmentation, Navigation and Reconstruction Dataset based on Muti-sensor for Autonomous Exploration	Jul 9, 2024	3D ReconstructionAutonomous Navigation	CodeCode Available	2
Training-free CryoET Tomogram Segmentation	Jul 8, 2024	Contrastive LearningCryogenic Electron Tomography	CodeCode Available	2

Show:10 25 50

← PrevPage 6 of 296Next →

All datasets ADE20K NYU-Depth V2 Cityscapes test Cityscapes val ADE20K val PASCAL Context S3DIS Area5 PASCAL VOC 2012 test S3DIS ScanNet SUN-RGBD DensePASS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	InternImage-H (M3I Pre-training)	Params (M)	1,310	—	Unverified
2	ViT-P (InternImage-H)	Validation mIoU	63.6	—	Unverified
3	ONE-PEACE	Validation mIoU	63	—	Unverified
4	M3I Pre-training (InternImage-H)	Validation mIoU	62.9	—	Unverified
5	InternImage-H	Validation mIoU	62.9	—	Unverified
6	BEiT-3	Validation mIoU	62.8	—	Unverified
7	EVA	Validation mIoU	62.3	—	Unverified
8	ViT-P (OneFormer, InternImage-H)	Validation mIoU	61.6	—	Unverified
9	ViT-Adapter-L (Mask2Former, BEiTv2 pretrain)	Validation mIoU	61.5	—	Unverified
10	FD-SwinV2-G	Validation mIoU	61.4	—	Unverified