Video Object Segmentation

Video object segmentation is a binary labeling problem aiming to separate foreground object(s) from the background region of a video.

For leaderboards please refer to the different subtasks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 551 papers

Title	Date	Tasks	Status	Hype
Dual Prototype Attention for Unsupervised Video Object Segmentation	Nov 22, 2022	ObjectSemantic Segmentation	CodeCode Available	1
LVOS: A Benchmark for Long-term Video Object Segmentation	Nov 18, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Global Spectral Filter Memory Network for Video Object Segmentation	Oct 11, 2022	AttributeDecoder	CodeCode Available	1
Self-supervised Video Representation Learning with Motion-Aware Masked Autoencoders	Oct 9, 2022	Representation LearningSemantic Segmentation	CodeCode Available	1
EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations	Sep 26, 2022	ObjectSegmentation	CodeCode Available	1
BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video	Sep 25, 2022	Long-tail Video Object SegmentationMulti-Object Tracking	CodeCode Available	1
A Simple and Powerful Global Optimization for Unsupervised Video Object Segmentation	Sep 19, 2022	Clusteringglobal-optimization	CodeCode Available	1
Unsupervised Video Object Segmentation via Prototype Memory Network	Sep 8, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Treating Motion as Option to Reduce Motion Dependency in Unsupervised Video Object Segmentation	Sep 4, 2022	Optical Flow EstimationSemantic Segmentation	CodeCode Available	1
SWEM: Towards Real-Time Video Object Segmentation with Sequential Weighted Expectation-Maximization	Aug 22, 2022	Semantic SegmentationSemi-Supervised Video Object Segmentation	CodeCode Available	1
Per-Clip Video Object Segmentation	Aug 3, 2022	ObjectSegmentation	CodeCode Available	1
Multi-Attention Network for Compressed Video Referring Object Segmentation	Jul 26, 2022	ObjectReferring Expression Segmentation	CodeCode Available	1
Semantic-Aware Fine-Grained Correspondence	Jul 21, 2022	Pose TrackingSelf-Supervised Learning	CodeCode Available	1
Hierarchical Feature Alignment Network for Unsupervised Video Object Segmentation	Jul 18, 2022	ObjectOptical Flow Estimation	CodeCode Available	1
Learning Quality-aware Dynamic Memory for Video Object Segmentation	Jul 16, 2022	SegmentationSemantic Segmentation	CodeCode Available	1
Tackling Background Distraction in Video Object Segmentation	Jul 14, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Towards Robust Referring Video Object Segmentation with Cyclic Relational Consensus	Jul 4, 2022	Referring Expression SegmentationReferring Video Object Segmentation	CodeCode Available	1
Towards Robust Video Object Segmentation with Adaptive Object Calibration	Jul 2, 2022	ObjectSegmentation	CodeCode Available	1
Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation	Jun 8, 2022	DenoisingReferring Video Object Segmentation	CodeCode Available	1
A Deeper Dive Into What Deep Spatiotemporal Networks Encode: Quantifying Static vs. Dynamic Information	Jun 6, 2022	Action RecognitionSemantic Segmentation	CodeCode Available	1
Differentiable Soft-Masked Attention	Jun 1, 2022	ObjectSegmentation	CodeCode Available	1
Recurrent Dynamic Embedding for Video Object Segmentation	May 8, 2022	ObjectSemantic Segmentation	CodeCode Available	1
In-N-Out Generative Learning for Dense Unsupervised Video Segmentation	Mar 29, 2022	Contrastive LearningSemantic Segmentation	CodeCode Available	1
Robust Visual Tracking by Segmentation	Mar 21, 2022	DecoderObject Tracking	CodeCode Available	1
Local-Global Context Aware Transformer for Language-Guided Video Segmentation	Mar 18, 2022	Referring Expression SegmentationReferring Video Object Segmentation	CodeCode Available	1
End-to-End Semi-Supervised Learning for Video Action Detection	Mar 8, 2022	Action DetectionClassification Consistency	CodeCode Available	1
Wnet: Audio-Guided Video Object Segmentation via Wavelet-Based Cross-Modal Denoising Networks	Jan 1, 2022	DecoderDenoising	CodeCode Available	1
HODOR: High-level Object Descriptors for Object Re-segmentation in Video Learned from Static Images	Dec 16, 2021	ObjectSemantic Segmentation	CodeCode Available	1
Autoencoder-based background reconstruction and foreground segmentation with background noise estimation	Dec 15, 2021	Foreground SegmentationSegmentation	CodeCode Available	1
Reliable Propagation-Correction Modulation for Video Object Segmentation	Dec 6, 2021	ObjectSemantic Segmentation	CodeCode Available	1
End-to-End Referring Video Object Segmentation with Multimodal Transformers	Nov 29, 2021	Inductive BiasInstance Segmentation	CodeCode Available	1
FAMINet: Learning Real-time Semi-supervised Video Object Segmentation with Steepest Optimized Optical Flow	Nov 20, 2021	Optical Flow EstimationSegmentation	CodeCode Available	1
D2Conv3D: Dynamic Dilated Convolutions for Object Segmentation in Videos	Nov 15, 2021	Multi-Object Tracking and SegmentationSegmentation	CodeCode Available	1
D^2Conv3D: Dynamic Dilated Convolutions for Object Segmentation in Videos	Nov 15, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Dense Unsupervised Learning for Video Segmentation	Nov 11, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Exploring the Semi-supervised Video Object Segmentation Problem from a Cyclic Perspective	Nov 2, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Pixel-Level Bijective Matching for Video Object Segmentation	Oct 4, 2021	ObjectSemantic Segmentation	CodeCode Available	1
Hierarchical Memory Matching Network for Video Object Segmentation	Sep 23, 2021	ObjectRetrieval	CodeCode Available	1
VIL-100: A New Dataset and A Baseline Model for Video Instance Lane Detection	Aug 19, 2021	Autonomous DrivingLane Detection	CodeCode Available	1
Multi-Source Fusion and Automatic Predictor Selection for Zero-Shot Video Object Segmentation	Aug 11, 2021	Depth EstimationObject	CodeCode Available	1
Joint Inductive and Transductive Learning for Video Object Segmentation	Aug 8, 2021	Inductive LearningObject	CodeCode Available	1
Full-Duplex Strategy for Video Object Segmentation	Aug 6, 2021	ObjectObject Detection	CodeCode Available	1
Self-Supervised Video Object Segmentation by Motion-Aware Mask Propagation	Jul 27, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Accelerating Video Object Segmentation with Compressed Video	Jul 26, 2021	ObjectSegmentation	CodeCode Available	1
Do Different Tracking Tasks Require Different Appearance Models?	Jul 5, 2021	Multi-Object TrackingMulti-Object Tracking and Segmentation	CodeCode Available	1
Delving Deep Into Many-to-Many Attention for Few-Shot Video Object Segmentation	Jun 19, 2021	Meta-LearningSemantic Segmentation	CodeCode Available	1
Reciprocal Transformations for Unsupervised Video Object Segmentation	Jun 19, 2021	ObjectOptical Flow Estimation	CodeCode Available	1
Rethinking Space-Time Networks with Improved Memory Coverage for Efficient Video Object Segmentation	Jun 9, 2021	Semantic SegmentationSemi-Supervised Video Object Segmentation	CodeCode Available	1
SynthRef: Generation of Synthetic Referring Expressions for Object Segmentation	Jun 8, 2021	Objectobject-detection	CodeCode Available	1
ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias	Jun 7, 2021	Image ClassificationInductive Bias	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 12Next →

All datasets DAVIS 2016 DAVIS 2017 (val)YouTube-VOS 2018 DAVIS-2017 (test-dev)YouTube-VOS 2019 DAVIS 2017 M^3-VOS FBMS YouTube FBMS-59 MOSE SegTrack-v2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	F-Score	94.7	—	Unverified
2	ISVOS (BL30K, MS)	J&F	93.4	—	Unverified
3	XMem (BL30K, MS)	J&F	93.3	—	Unverified
4	BATMAN (val)	J&F	92.5	—	Unverified
5	STCN (val)	J&F	91.6	—	Unverified
6	XMem	J&F	91.5	—	Unverified
7	MobileVOS (val)	J&F	91.4	—	Unverified
8	AOT (val)	J&F	91.1	—	Unverified
9	LCM (val)	J&F	90.7	—	Unverified
10	RPCMVOS (val)	J&F	90.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BLK30K, MS)	Mean Jaccard & F-Measure	89.5	—	Unverified
2	LCM	F-measure	86.5	—	Unverified
3	XMem	Mean Jaccard & F-Measure	86.2	—	Unverified
4	BATMAN	Mean Jaccard & F-Measure	86.2	—	Unverified
5	STCN	Mean Jaccard & F-Measure	85.4	—	Unverified
6	AOT	Mean Jaccard & F-Measure	84.9	—	Unverified
7	STM	F-measure	84.3	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
9	RPCMVOS	Mean Jaccard & F-Measure	83.7	—	Unverified
10	RMN	Mean Jaccard & F-Measure	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	86.9	—	Unverified
2	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
3	RPCMVOS	Mean Jaccard & F-Measure	84	—	Unverified
4	STCN	Mean Jaccard & F-Measure	83	—	Unverified
5	CFBI+	Mean Jaccard & F-Measure	82.8	—	Unverified
6	RMN	Jaccard (Seen)	82.1	—	Unverified
7	LCM	Mean Jaccard & F-Measure	82	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	81.8	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.7	—	Unverified
10	LWL	Mean Jaccard & F-Measure	81.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	83.7	—	Unverified
2	XMem	Mean Jaccard & F-Measure	81	—	Unverified
3	BATMAN	Jaccard	78.4	—	Unverified
4	AOT	Jaccard	75.9	—	Unverified
5	RPCMVOS	Jaccard	75.8	—	Unverified
6	LCM	Jaccard	74.4	—	Unverified
7	KMN	Jaccard	74.1	—	Unverified
8	TransVOS	Jaccard	73	—	Unverified
9	STCN	Jaccard	72.7	—	Unverified
10	RMN	Jaccard	71.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K,MS)	Mean Jaccard & F-Measure	86.8	—	Unverified
2	XMem	Mean Jaccard & F-Measure	85.5	—	Unverified
3	BATMAN	Mean Jaccard & F-Measure	85	—	Unverified
4	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
5	RPCMVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
6	MobileVOS	Mean Jaccard & F-Measure	83.3	—	Unverified
7	STCN	Mean Jaccard & F-Measure	82.7	—	Unverified
8	CFBI+	Mean Jaccard & F-Measure	82.6	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.8	—	Unverified
10	CFBI	Mean Jaccard & F-Measure	81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	Jaccard (Mean)	81.7	—	Unverified
2	ViTAE-T-Stage	Jaccard (Mean)	79.4	—	Unverified
3	DINO (ViT-B/8, ImageNet retrain)	J&F	71.4	—	Unverified
4	VOSwL (Mask+Language)	mIoU	59	—	Unverified
5	UniTrack	mIoU	58.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVOS	Average IOU	75.6	—	Unverified
2	Cutie-base	Average IOU	74.6	—	Unverified
3	XMem	Average IOU	70.4	—	Unverified
4	SAM 2	Average IOU	69.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DFNet	F-Score	82.3	—	Unverified
2	ours	Jaccard (Mean)	76.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours	Average	74.9	—	Unverified
2	FEELVOS	mIoU	0.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	68.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Cutie	J&F	68.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	79.9	—	Unverified