Video Semantic Segmentation

The goal of video semantic segmentation is to assign a predefined class to each pixel in all frames of a video. This requires the model not only to predict accurate segmentation masks but also to ensure that these masks remain temporally consistent across frames. This task has broad applications in areas such as autonomous driving, medical video analysis, and AR/VR.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–425 of 895 papers

Title	Date	Tasks	Status	Hype
Dual Prototype Attention for Unsupervised Video Object Segmentation	Nov 22, 2022	ObjectSemantic Segmentation	CodeCode Available	1
LVOS: A Benchmark for Long-term Video Object Segmentation	Nov 18, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Robust Online Video Instance Segmentation with Track Queries	Nov 16, 2022	Image SegmentationInstance Segmentation	CodeCode Available	0
Visual Semantic Segmentation Based on Few/Zero-Shot Learning: An Overview	Nov 13, 2022	SegmentationSemantic Segmentation	—Unverified	0
Efficient Unsupervised Video Object Segmentation Network Based on Motion Guidance	Nov 10, 2022	object-detectionObject Detection	—Unverified	0
Generalized Product-of-Experts for Learning Multimodal Representations in Noisy Environments	Nov 7, 2022	3D Hand Pose EstimationHand Pose Estimation	—Unverified	0
Domain Adaptive Video Semantic Segmentation via Cross-Domain Moving Object Mixing	Nov 4, 2022	Domain AdaptationSemantic Segmentation	CodeCode Available	1
Quantifying and Learning Static vs. Dynamic Information in Deep Spatiotemporal Networks	Nov 3, 2022	Action RecognitionInstance Segmentation	—Unverified	0
Two-Level Temporal Relation Model for Online Video Instance Segmentation	Oct 30, 2022	Graph Neural NetworkInstance Segmentation	CodeCode Available	0
Self-supervised Amodal Video Object Segmentation	Oct 23, 2022	ObjectSegmentation	CodeCode Available	0
Decoupling Features in Hierarchical Propagation for Video Object Segmentation	Oct 18, 2022	ObjectSemantic Segmentation	CodeCode Available	2
EISeg: An Efficient Interactive Segmentation Tool based on PaddlePaddle	Oct 17, 2022	Image SegmentationInteractive Segmentation	—Unverified	0
Global Spectral Filter Memory Network for Video Object Segmentation	Oct 11, 2022	AttributeDecoder	CodeCode Available	1
Self-supervised Video Representation Learning with Motion-Aware Masked Autoencoders	Oct 9, 2022	Representation LearningSemantic Segmentation	CodeCode Available	1
Motion-inductive Self-supervised Object Discovery in Videos	Oct 1, 2022	ObjectObject Discovery	—Unverified	0
EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations	Sep 26, 2022	ObjectSegmentation	CodeCode Available	1
BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video	Sep 25, 2022	Long-tail Video Object SegmentationMulti-Object Tracking	CodeCode Available	1
Multi-modal Segment Assemblage Network for Ad Video Editing with Importance-Coherence Reward	Sep 25, 2022	DecoderVideo Editing	CodeCode Available	1
A Simple and Powerful Global Optimization for Unsupervised Video Object Segmentation	Sep 19, 2022	Clusteringglobal-optimization	CodeCode Available	1
MCIBI++: Soft Mining Contextual Information Beyond Image for Semantic Segmentation	Sep 9, 2022	SegmentationSemantic Segmentation	CodeCode Available	2
Unsupervised Video Object Segmentation via Prototype Memory Network	Sep 8, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Pixel-Level Equalized Matching for Video Object Segmentation	Sep 4, 2022	ObjectSemantic Segmentation	—Unverified	0
Treating Motion as Option to Reduce Motion Dependency in Unsupervised Video Object Segmentation	Sep 4, 2022	Optical Flow EstimationSemantic Segmentation	CodeCode Available	1
TokenCut: Segmenting Objects in Images and Videos with Self-supervised Transformer and Normalized Cut	Sep 1, 2022	Object DiscoverySaliency Detection	—Unverified	0
Hierarchical Reinforcement Learning Based Video Semantic Coding for Segmentation	Aug 24, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 17 of 36Next →

All datasets Cityscapes val CamVid VSPW LaRS Multispectral Video Semantic Segmentation

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TMANet-50	mIoU	80.3	—	Unverified
2	TDNet-50 [9]	mIoU	79.9	—	Unverified
3	DeltaDist-DDRNet-39	mIoU	79.9	—	Unverified
4	PSPNet-101 [20]	mIoU	79.7	—	Unverified
5	PSPNet-50 [20]	mIoU	78.1	—	Unverified
6	LVS [12]	mIoU	76.8	—	Unverified
7	GRFP [15]	mIoU	73.6	—	Unverified
8	FCN-50 [14]	mIoU	70.1	—	Unverified
9	DFF [22]	mIoU	69.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TMANet-50	Mean IoU	76.5	—	Unverified
2	ETC-MobileNet	Mean IoU	76.3	—	Unverified
3	TDNet-50	Mean IoU	76.2	—	Unverified
4	PSPNet-50	Mean IoU	76	—	Unverified
5	Netwarp	Mean IoU	74.7	—	Unverified
6	GRFP	Mean IoU	67.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVIS++(VIT-L)	mIoU	63.8	—	Unverified
2	UniVS(Swin-L)	mIoU	59.8	—	Unverified
3	Tube-Link(Swin-large)	mIoU	59.6	—	Unverified
4	MRCFA(MiT-B5)	mIoU	49.9	—	Unverified
5	CFFM(MiT-B5)	mIoU	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WaSR-T (ResNet-101)	Q	60.1	—	Unverified
2	TMANet (ResNet-50)	Q	57.5	—	Unverified
3	CSANet (ResNet-101)	Q	49.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MVNet(DeepLabV3)	mIoU	54.52	—	Unverified
2	MVNet(PSPNet)	mIoU	54.36	—	Unverified
3	MVNet(FCN)	mIoU	53.9	—	Unverified