Scene Parsing

Scene parsing is to segment and parse an image into different image regions associated with semantic categories, such as sky, road, person, and bed. MIT Description

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 199 papers

Title	Date	Tasks	Status	Hype
A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects	Jun 16, 2025	BenchmarkingInstance Segmentation	—Unverified	0
DepthMatch: Semi-Supervised RGB-D Scene Parsing through Depth-Guided Regularization	May 26, 2025	Scene ParsingSemantic Segmentation	—Unverified	0
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation	May 5, 2025	Image GenerationScene Generation	—Unverified	0
Fully Exploiting Vision Foundation Model's Profound Prior Knowledge for Generalizable RGB-Depth Driving Scene Parsing	Feb 10, 2025	Depth EstimationDepth Prediction	—Unverified	0
Hardware implementation of timely reliable Bayesian decision-making using memristors	Dec 7, 2024	Bayesian InferenceDecision Making	—Unverified	0
OLAF: A Plug-and-Play Framework for Enhanced Multi-object Multi-part Scene Parsing	Nov 5, 2024	Scene ParsingScene Segmentation	—Unverified	0
RoadFormer+: Delivering RGB-X Scene Parsing through Scale-Aware Information Decoupling and Advanced Heterogeneous Feature Fusion	Jul 31, 2024	Scene ParsingSemantic Segmentation	—Unverified	0
Multi-Grained Contrast for Data-Efficient Unsupervised Representation Learning	Jul 2, 2024	Contrastive LearningInstance Segmentation	CodeCode Available	1
PIG: Prompt Images Guidance for Night-Time Scene Parsing	Jun 15, 2024	Data AugmentationDomain Adaptation	CodeCode Available	0
1st Place Winner of the 2024 Pixel-level Video Understanding in the Wild (CVPR'24 PVUW) Challenge in Video Panoptic Segmentation and Best Long Video Consistency of Video Semantic Segmentation	Jun 8, 2024	BenchmarkingInstance Segmentation	—Unverified	0
Radar Spectra-Language Model for Automotive Scene Parsing	Jun 4, 2024	Autonomous DrivingLanguage Modeling	—Unverified	0
Semi-supervised Video Semantic Segmentation Using Unreliable Pseudo Labels for PVUW2024	Jun 2, 2024	Scene ParsingScene Understanding	—Unverified	0
Few-Shot Fruit Segmentation via Transfer Learning	May 4, 2024	Few-Shot Semantic SegmentationScene Parsing	CodeCode Available	0
Compositional Factorization of Visual Scenes with Convolutional Sparse Coding and Resonator Networks	Apr 29, 2024	Scene Parsing	—Unverified	0
HAPNet: Toward Superior RGB-Thermal Scene Parsing via Hybrid, Asymmetric, and Progressive Heterogeneous Feature Fusion	Apr 4, 2024	Scene ParsingSemantic Segmentation	CodeCode Available	0
Robust Shape Fitting for 3D Scene Abstraction	Mar 15, 2024	Depth EstimationScene Parsing	CodeCode Available	2
Feature boosting with efficient attention for scene parsing	Feb 29, 2024	Scene Parsing	—Unverified	0
Applying Unsupervised Semantic Segmentation to High-Resolution UAV Imagery for Enhanced Road Scene Parsing	Feb 5, 2024	Language ModellingRepresentation Learning	CodeCode Available	0
LF Tracy: A Unified Single-Pipeline Approach for Salient Object Detection in Light Field Cameras	Jan 30, 2024	Data AugmentationDecoder	CodeCode Available	0
SAI3D: Segment Any Instance in 3D Scenes	Dec 17, 2023	3D Instance SegmentationInstance Segmentation	—Unverified	0
A Review and A Robust Framework of Data-Efficient 3D Scene Parsing with Traditional/Learned 3D Descriptors	Dec 3, 2023	Active LearningInstance Segmentation	—Unverified	0
A Data-efficient Framework for Robotics Large-scale LiDAR Scene Parsing	Dec 3, 2023	Autonomous NavigationData Augmentation	—Unverified	0
Generalized Robot 3D Vision-Language Model with Fast Rendering and Pre-Training Vision-Language Alignment	Dec 1, 2023	Contrastive LearningFew-Shot Learning	CodeCode Available	3
CaveSeg: Deep Semantic Segmentation and Scene Parsing for Autonomous Underwater Cave Exploration	Sep 20, 2023	Scene ParsingSegmentation	—Unverified	0
RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing	Sep 19, 2023	DecoderScene Parsing	—Unverified	0
CACFNet: Cross-Modal Attention Cascaded Fusion Network for RGB-T Urban Scene Parsing	Sep 14, 2023	Scene ParsingThermal Image Segmentation	—Unverified	0
EGFNet: Edge-Aware Guidance Fusion Network for RGB–Thermal Urban Scene Parsing	Aug 15, 2023	Scene ParsingSemantic Segmentation	CodeCode Available	1
Improving Panoptic Segmentation for Nighttime or Low-Illumination Urban Driving Scenes	Jun 23, 2023	Autonomous VehiclesPanoptic Segmentation	CodeCode Available	0
Semantic Segmentation on VSPW Dataset through Contrastive Loss and Multi-dataset Training Approach	Jun 6, 2023	Scene ParsingSemantic Segmentation	—Unverified	0
Recyclable Semi-supervised Method Based on Multi-model Ensemble for Video Scene Parsing	Jun 5, 2023	Scene ParsingScene Understanding	—Unverified	0
Cross-CBAM: A Lightweight network for Scene Segmentation	Jun 4, 2023	Edge-computingReal-Time Semantic Segmentation	—Unverified	0
Treasure What You Have: Exploiting Similarity in Deep Neural Networks for Efficient Video Processing	May 10, 2023	Computational EfficiencyLane Detection	—Unverified	0
RT-K-Net: Revisiting K-Net for Real-Time Panoptic Segmentation	May 2, 2023	GPUInstance Segmentation	CodeCode Available	1
Local and Global Contextual Features Fusion for Pedestrian Intention Prediction	May 1, 2023	Autonomous VehiclesScene Parsing	—Unverified	0
DPF: Learning Dense Prediction Fields with Weak Supervision	Mar 29, 2023	Intrinsic Image DecompositionPrediction	CodeCode Available	1
Traffic Scene Parsing through the TSP6K Dataset	Mar 6, 2023	Autonomous DrivingDecoder	CodeCode Available	1
Visual Traffic Knowledge Graph Generation from Scene Images	Jan 1, 2023	Graph AttentionGraph Generation	—Unverified	0
Re:PolyWorld - A Graph Neural Network for Polygonal Scene Parsing	Jan 1, 2023	Graph Neural NetworkInstance Segmentation	—Unverified	0
Uni-3D: A Universal Model for Panoptic 3D Scene Reconstruction	Jan 1, 2023	3D Scene ReconstructionImage Segmentation	CodeCode Available	1
Weakly Supervised Class-Agnostic Motion Prediction for Autonomous Driving	Jan 1, 2023	Autonomous Drivingmotion prediction	—Unverified	0
Multi-Sem Fusion: Multimodal Semantic Fusion for 3D Object Detection	Dec 10, 2022	2D Semantic Segmentation3D Object Detection	—Unverified	0
OneFormer: One Transformer to Rule Universal Image Segmentation	Nov 10, 2022	Instance SegmentationPanoptic Segmentation	CodeCode Available	3
GEBNet: Graph-Enhancement Branch Network for RGB-T Scene Parsing	Oct 31, 2022	DecoderScene Parsing	—Unverified	0
VIBUS: Data-efficient 3D Scene Parsing with VIewpoint Bottleneck and Uncertainty-Spectrum Modeling	Oct 20, 2022	Representation LearningScene Parsing	CodeCode Available	1
Boosting Night-time Scene Parsing with Learnable Frequency	Aug 30, 2022	Autonomous DrivingScene Parsing	CodeCode Available	1
A Dense Material Segmentation Dataset for Indoor and Outdoor Scene Parsing	Jul 21, 2022	Material ClassificationMaterial Recognition	CodeCode Available	1
Plane Geometry Diagram Parsing	May 19, 2022	Geometry Problem SolvingGraph Neural Network	CodeCode Available	1
FLOAT: Factorized Learning of Object Attributes for Improved Multi-object Multi-part Scene Parsing	Mar 30, 2022	2D Semantic SegmentationObject	CodeCode Available	0
TO-Scene: A Large-scale Dataset for Understanding 3D Tabletop Scenes	Mar 17, 2022	3D Semantic Segmentationobject-detection	CodeCode Available	1
Boundary Corrected Multi-scale Fusion Network for Real-time Semantic Segmentation	Mar 1, 2022	Real-Time Semantic SegmentationScene Parsing	—Unverified	0

Show:10 25 50

← PrevPage 1 of 4Next →

All datasets PGDP5K Cityscapes test

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PGDPNet	Total Accuracy	84.7	—	Unverified
2	Inter-GPS	Total Accuracy	27.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VCD No Coarse	mIoU	82.3	—	Unverified