Video Semantic Segmentation

The goal of video semantic segmentation is to assign a predefined class to each pixel in all frames of a video. This requires the model not only to predict accurate segmentation masks but also to ensure that these masks remain temporally consistent across frames. This task has broad applications in areas such as autonomous driving, medical video analysis, and AR/VR.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 895 papers

Title	Date	Tasks	Status	Hype
Video Object Segmentation-aware Video Frame Interpolation	Jan 1, 2023	ObjectPose Estimation	CodeCode Available	1
Multispectral Video Semantic Segmentation: A Benchmark Dataset and Baseline	Jan 1, 2023	SegmentationSemantic Segmentation	CodeCode Available	1
Context-Aware Relative Object Queries To Unify Video Instance and Panoptic Segmentation	Jan 1, 2023	Instance SegmentationMulti-Object Tracking	CodeCode Available	1
1st Place Solution for YouTubeVOS Challenge 2022: Referring Video Object Segmentation	Dec 27, 2022	ObjectReferring Video Object Segmentation	CodeCode Available	1
Learning to Learn Better for Video Object Segmentation	Dec 5, 2022	Inductive LearningObject	CodeCode Available	1
Dual Prototype Attention for Unsupervised Video Object Segmentation	Nov 22, 2022	ObjectSemantic Segmentation	CodeCode Available	1
LVOS: A Benchmark for Long-term Video Object Segmentation	Nov 18, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Domain Adaptive Video Semantic Segmentation via Cross-Domain Moving Object Mixing	Nov 4, 2022	Domain AdaptationSemantic Segmentation	CodeCode Available	1
Global Spectral Filter Memory Network for Video Object Segmentation	Oct 11, 2022	AttributeDecoder	CodeCode Available	1
Self-supervised Video Representation Learning with Motion-Aware Masked Autoencoders	Oct 9, 2022	Representation LearningSemantic Segmentation	CodeCode Available	1
EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations	Sep 26, 2022	ObjectSegmentation	CodeCode Available	1
BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video	Sep 25, 2022	Long-tail Video Object SegmentationMulti-Object Tracking	CodeCode Available	1
Multi-modal Segment Assemblage Network for Ad Video Editing with Importance-Coherence Reward	Sep 25, 2022	DecoderVideo Editing	CodeCode Available	1
A Simple and Powerful Global Optimization for Unsupervised Video Object Segmentation	Sep 19, 2022	Clusteringglobal-optimization	CodeCode Available	1
Unsupervised Video Object Segmentation via Prototype Memory Network	Sep 8, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Treating Motion as Option to Reduce Motion Dependency in Unsupervised Video Object Segmentation	Sep 4, 2022	Optical Flow EstimationSemantic Segmentation	CodeCode Available	1
SWEM: Towards Real-Time Video Object Segmentation with Sequential Weighted Expectation-Maximization	Aug 22, 2022	Semantic SegmentationSemi-Supervised Video Object Segmentation	CodeCode Available	1
Per-Clip Video Object Segmentation	Aug 3, 2022	ObjectSegmentation	CodeCode Available	1
Multi-Attention Network for Compressed Video Referring Object Segmentation	Jul 26, 2022	ObjectReferring Expression Segmentation	CodeCode Available	1
Semantic-Aware Fine-Grained Correspondence	Jul 21, 2022	Pose TrackingSelf-Supervised Learning	CodeCode Available	1
Mining Relations among Cross-Frame Affinities for Video Semantic Segmentation	Jul 21, 2022	Optical Flow EstimationSemantic Segmentation	CodeCode Available	1
Hierarchical Feature Alignment Network for Unsupervised Video Object Segmentation	Jul 18, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Adversarial Pixel Restoration as a Pretext Task for Transferable Perturbations	Jul 18, 2022	object-detectionObject Detection	CodeCode Available	1
Learning Quality-aware Dynamic Memory for Video Object Segmentation	Jul 16, 2022	SegmentationSemantic Segmentation	CodeCode Available	1
Tackling Background Distraction in Video Object Segmentation	Jul 14, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Domain Adaptive Video Segmentation via Temporal Pseudo Supervision	Jul 6, 2022	SegmentationSemantic Segmentation	CodeCode Available	1
Towards Robust Referring Video Object Segmentation with Cyclic Relational Consensus	Jul 4, 2022	Referring Expression SegmentationReferring Video Object Segmentation	CodeCode Available	1
Towards Robust Video Object Segmentation with Adaptive Object Calibration	Jul 2, 2022	ObjectSegmentation	CodeCode Available	1
Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation	Jun 8, 2022	DenoisingReferring Video Object Segmentation	CodeCode Available	1
A Deeper Dive Into What Deep Spatiotemporal Networks Encode: Quantifying Static vs. Dynamic Information	Jun 6, 2022	Action RecognitionSemantic Segmentation	CodeCode Available	1
Differentiable Soft-Masked Attention	Jun 1, 2022	ObjectSegmentation	CodeCode Available	1
Recurrent Dynamic Embedding for Video Object Segmentation	May 8, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Video K-Net: A Simple, Strong, and Unified Baseline for Video Segmentation	Apr 10, 2022	Image SegmentationInstance Segmentation	CodeCode Available	1
Learning Local and Global Temporal Contexts for Video Semantic Segmentation	Apr 7, 2022	SegmentationSemantic Segmentation	CodeCode Available	1
Modeling Motion with Multi-Modal Features for Text-Based Video Segmentation	Apr 6, 2022	Optical Flow EstimationReferring Expression Segmentation	CodeCode Available	1
In-N-Out Generative Learning for Dense Unsupervised Video Segmentation	Mar 29, 2022	Contrastive LearningSemantic Segmentation	CodeCode Available	1
Robust Visual Tracking by Segmentation	Mar 21, 2022	DecoderObject Tracking	CodeCode Available	1
Local-Global Context Aware Transformer for Language-Guided Video Segmentation	Mar 18, 2022	Referring Expression SegmentationReferring Video Object Segmentation	CodeCode Available	1
Temporal Context for Robust Maritime Obstacle Detection	Mar 10, 2022	ObjectPanoptic Segmentation	CodeCode Available	1
RankSeg: Adaptive Pixel Classification with Image Category Ranking for Segmentation	Mar 8, 2022	ClassificationInstance Segmentation	CodeCode Available	1
End-to-End Semi-Supervised Learning for Video Action Detection	Mar 8, 2022	Action DetectionClassification Consistency	CodeCode Available	1
Semi-Supervised Video Semantic Segmentation With Inter-Frame Feature Reconstruction	Jan 1, 2022	SegmentationSemantic Segmentation	CodeCode Available	1
Wnet: Audio-Guided Video Object Segmentation via Wavelet-Based Cross-Modal Denoising Networks	Jan 1, 2022	DecoderDenoising	CodeCode Available	1
HODOR: High-level Object Descriptors for Object Re-segmentation in Video Learned from Static Images	Dec 16, 2021	ObjectSemantic Segmentation	CodeCode Available	1
Reliable Propagation-Correction Modulation for Video Object Segmentation	Dec 6, 2021	ObjectSemantic Segmentation	CodeCode Available	1
End-to-End Referring Video Object Segmentation with Multimodal Transformers	Nov 29, 2021	Inductive BiasInstance Segmentation	CodeCode Available	1
FAMINet: Learning Real-time Semi-supervised Video Object Segmentation with Steepest Optimized Optical Flow	Nov 20, 2021	Optical Flow EstimationSegmentation	CodeCode Available	1
D2Conv3D: Dynamic Dilated Convolutions for Object Segmentation in Videos	Nov 15, 2021	Multi-Object Tracking and SegmentationSegmentation	CodeCode Available	1
D^2Conv3D: Dynamic Dilated Convolutions for Object Segmentation in Videos	Nov 15, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Dense Unsupervised Learning for Video Segmentation	Nov 11, 2021	SegmentationSemantic Segmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 18Next →

All datasets Cityscapes val CamVid VSPW LaRS Multispectral Video Semantic Segmentation

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TMANet-50	mIoU	80.3	—	Unverified
2	DeltaDist-DDRNet-39	mIoU	79.9	—	Unverified
3	TDNet-50 [9]	mIoU	79.9	—	Unverified
4	PSPNet-101 [20]	mIoU	79.7	—	Unverified
5	PSPNet-50 [20]	mIoU	78.1	—	Unverified
6	LVS [12]	mIoU	76.8	—	Unverified
7	GRFP [15]	mIoU	73.6	—	Unverified
8	FCN-50 [14]	mIoU	70.1	—	Unverified
9	DFF [22]	mIoU	69.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TMANet-50	Mean IoU	76.5	—	Unverified
2	ETC-MobileNet	Mean IoU	76.3	—	Unverified
3	TDNet-50	Mean IoU	76.2	—	Unverified
4	PSPNet-50	Mean IoU	76	—	Unverified
5	Netwarp	Mean IoU	74.7	—	Unverified
6	GRFP	Mean IoU	67.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVIS++(VIT-L)	mIoU	63.8	—	Unverified
2	UniVS(Swin-L)	mIoU	59.8	—	Unverified
3	Tube-Link(Swin-large)	mIoU	59.6	—	Unverified
4	MRCFA(MiT-B5)	mIoU	49.9	—	Unverified
5	CFFM(MiT-B5)	mIoU	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WaSR-T (ResNet-101)	Q	60.1	—	Unverified
2	TMANet (ResNet-50)	Q	57.5	—	Unverified
3	CSANet (ResNet-101)	Q	49.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVNet(DeepLabV3)	mIoU	54.52	—	Unverified
2	MVNet(PSPNet)	mIoU	54.36	—	Unverified
3	MVNet(FCN)	mIoU	53.9	—	Unverified