Video Semantic Segmentation

The goal of video semantic segmentation is to assign a predefined class to each pixel in all frames of a video. This requires the model not only to predict accurate segmentation masks but also to ensure that these masks remain temporally consistent across frames. This task has broad applications in areas such as autonomous driving, medical video analysis, and AR/VR.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 895 papers

Title	Date	Tasks	Status	Hype
Context-Aware Relative Object Queries To Unify Video Instance and Panoptic Segmentation	Jan 1, 2023	Instance SegmentationMulti-Object Tracking	CodeCode Available	1
Multispectral Video Semantic Segmentation: A Benchmark Dataset and Baseline	Jan 1, 2023	SegmentationSemantic Segmentation	CodeCode Available	1
End-to-End Video Matting With Trimap Propagation	Jan 1, 2023	Image MattingSegmentation	CodeCode Available	1
1st Place Solution for YouTubeVOS Challenge 2022: Referring Video Object Segmentation	Dec 27, 2022	ObjectReferring Video Object Segmentation	CodeCode Available	1
Learning to Learn Better for Video Object Segmentation	Dec 5, 2022	Inductive LearningObject	CodeCode Available	1
Dual Prototype Attention for Unsupervised Video Object Segmentation	Nov 22, 2022	ObjectSemantic Segmentation	CodeCode Available	1
LVOS: A Benchmark for Long-term Video Object Segmentation	Nov 18, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Domain Adaptive Video Semantic Segmentation via Cross-Domain Moving Object Mixing	Nov 4, 2022	Domain AdaptationSemantic Segmentation	CodeCode Available	1
Global Spectral Filter Memory Network for Video Object Segmentation	Oct 11, 2022	AttributeDecoder	CodeCode Available	1
Self-supervised Video Representation Learning with Motion-Aware Masked Autoencoders	Oct 9, 2022	Representation LearningSemantic Segmentation	CodeCode Available	1
EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations	Sep 26, 2022	ObjectSegmentation	CodeCode Available	1
BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video	Sep 25, 2022	Long-tail Video Object SegmentationMulti-Object Tracking	CodeCode Available	1
Multi-modal Segment Assemblage Network for Ad Video Editing with Importance-Coherence Reward	Sep 25, 2022	DecoderVideo Editing	CodeCode Available	1
A Simple and Powerful Global Optimization for Unsupervised Video Object Segmentation	Sep 19, 2022	Clusteringglobal-optimization	CodeCode Available	1
Unsupervised Video Object Segmentation via Prototype Memory Network	Sep 8, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Treating Motion as Option to Reduce Motion Dependency in Unsupervised Video Object Segmentation	Sep 4, 2022	Optical Flow EstimationSemantic Segmentation	CodeCode Available	1
SWEM: Towards Real-Time Video Object Segmentation with Sequential Weighted Expectation-Maximization	Aug 22, 2022	Semantic SegmentationSemi-Supervised Video Object Segmentation	CodeCode Available	1
Per-Clip Video Object Segmentation	Aug 3, 2022	ObjectSegmentation	CodeCode Available	1
Multi-Attention Network for Compressed Video Referring Object Segmentation	Jul 26, 2022	ObjectReferring Expression Segmentation	CodeCode Available	1
Semantic-Aware Fine-Grained Correspondence	Jul 21, 2022	Pose TrackingSelf-Supervised Learning	CodeCode Available	1
Mining Relations among Cross-Frame Affinities for Video Semantic Segmentation	Jul 21, 2022	Optical Flow EstimationSemantic Segmentation	CodeCode Available	1
Adversarial Pixel Restoration as a Pretext Task for Transferable Perturbations	Jul 18, 2022	object-detectionObject Detection	CodeCode Available	1
Hierarchical Feature Alignment Network for Unsupervised Video Object Segmentation	Jul 18, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Learning Quality-aware Dynamic Memory for Video Object Segmentation	Jul 16, 2022	SegmentationSemantic Segmentation	CodeCode Available	1
Tackling Background Distraction in Video Object Segmentation	Jul 14, 2022	ObjectSemantic Segmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 7 of 36Next →

All datasets Cityscapes val CamVid VSPW LaRS Multispectral Video Semantic Segmentation

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TMANet-50	mIoU	80.3	—	Unverified
2	TDNet-50 [9]	mIoU	79.9	—	Unverified
3	DeltaDist-DDRNet-39	mIoU	79.9	—	Unverified
4	PSPNet-101 [20]	mIoU	79.7	—	Unverified
5	PSPNet-50 [20]	mIoU	78.1	—	Unverified
6	LVS [12]	mIoU	76.8	—	Unverified
7	GRFP [15]	mIoU	73.6	—	Unverified
8	FCN-50 [14]	mIoU	70.1	—	Unverified
9	DFF [22]	mIoU	69.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TMANet-50	Mean IoU	76.5	—	Unverified
2	ETC-MobileNet	Mean IoU	76.3	—	Unverified
3	TDNet-50	Mean IoU	76.2	—	Unverified
4	PSPNet-50	Mean IoU	76	—	Unverified
5	Netwarp	Mean IoU	74.7	—	Unverified
6	GRFP	Mean IoU	67.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVIS++(VIT-L)	mIoU	63.8	—	Unverified
2	UniVS(Swin-L)	mIoU	59.8	—	Unverified
3	Tube-Link(Swin-large)	mIoU	59.6	—	Unverified
4	MRCFA(MiT-B5)	mIoU	49.9	—	Unverified
5	CFFM(MiT-B5)	mIoU	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WaSR-T (ResNet-101)	Q	60.1	—	Unverified
2	TMANet (ResNet-50)	Q	57.5	—	Unverified
3	CSANet (ResNet-101)	Q	49.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVNet(DeepLabV3)	mIoU	54.52	—	Unverified
2	MVNet(PSPNet)	mIoU	54.36	—	Unverified
3	MVNet(FCN)	mIoU	53.9	—	Unverified