Video Object Segmentation

Video object segmentation is a binary labeling problem aiming to separate foreground object(s) from the background region of a video.

For leaderboards please refer to the different subtasks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 551 papers

Title	Date	Tasks	Status	Hype
End-to-End Semi-Supervised Learning for Video Action Detection	Mar 8, 2022	Action DetectionClassification Consistency	CodeCode Available	1
1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation	Jun 11, 2024	Referring Video Object SegmentationSegmentation	CodeCode Available	1
Accelerating Video Object Segmentation with Compressed Video	Jul 26, 2021	ObjectSegmentation	CodeCode Available	1
LVOS: A Benchmark for Long-term Video Object Segmentation	Nov 18, 2022	ObjectSemantic Segmentation	CodeCode Available	1
Making a Case for 3D Convolutions for Object Segmentation in Videos	Aug 26, 2020	DecoderSegmentation	CodeCode Available	1
Adaptive Multi-source Predictor for Zero-shot Video Object Segmentation	Mar 18, 2023	ObjectOptical Flow Estimation	CodeCode Available	1
Boosting Video Object Segmentation via Space-time Correspondence Learning	Apr 13, 2023	ObjectSegmentation	CodeCode Available	1
Bootstrapping Objectness from Videos by Relaxed Common Fate and Visual Grouping	Apr 17, 2023	Motion SegmentationObject	CodeCode Available	1
End-to-End Referring Video Object Segmentation with Multimodal Transformers	Nov 29, 2021	Inductive BiasInstance Segmentation	CodeCode Available	1
Breaking Shortcut: Exploring Fully Convolutional Cycle-Consistency for Video Correspondence Learning	May 12, 2021	Landmark TrackingPose Tracking	CodeCode Available	1
A Deeper Dive Into What Deep Spatiotemporal Networks Encode: Quantifying Static vs. Dynamic Information	Jun 6, 2022	Action RecognitionSemantic Segmentation	CodeCode Available	1
Emerging Properties in Self-Supervised Vision Transformers	Apr 29, 2021	Copy DetectionImage Classification	CodeCode Available	1
Betrayed by Attention: A Simple yet Effective Approach for Self-supervised Video Object Segmentation	Nov 29, 2023	ClusteringObject	CodeCode Available	1
Local-Global Context Aware Transformer for Language-Guided Video Segmentation	Mar 18, 2022	Referring Expression SegmentationReferring Video Object Segmentation	CodeCode Available	1
Lester: rotoscope animation through video object segmentation and tracking	Feb 15, 2024	3D Human Pose EstimationObject	CodeCode Available	1
LiVOS: Light Video Object Segmentation with Gated Linear Matching	Nov 5, 2024	GPUSemantic Segmentation	CodeCode Available	1
LoSh: Long-Short Text Joint Prediction Network for Referring Video Object Segmentation	Jun 14, 2023	Referring Expression SegmentationReferring Video Object Segmentation	CodeCode Available	1
Learning Dynamic Network Using a Reuse Gate Function in Semi-supervised Video Object Segmentation	Dec 21, 2020	One-shot visual object segmentationSegmentation	CodeCode Available	1
Autoencoder-based background reconstruction and foreground segmentation with background noise estimation	Dec 15, 2021	Foreground SegmentationSegmentation	CodeCode Available	1
Learning Video Object Segmentation from Unlabeled Videos	Mar 10, 2020	ObjectRepresentation Learning	CodeCode Available	1
Active Boundary Loss for Semantic Segmentation	Feb 4, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Attention-guided Temporally Coherent Video Object Matting	May 24, 2021	Image MattingObject	CodeCode Available	1
End-to-End Video Matting With Trimap Propagation	Jan 1, 2023	Image MattingSegmentation	CodeCode Available	1
Learning to Recommend Frame for Interactive Video Object Segmentation in the Wild	Mar 18, 2021	Deep Reinforcement LearningInteractive Video Object Segmentation	CodeCode Available	1
Learning What to Learn for Video Object Segmentation	Mar 25, 2020	Few-Shot LearningObject	CodeCode Available	1
MAST: A Memory-Augmented Self-supervised Tracker	Feb 18, 2020	Semantic SegmentationSemi-Supervised Video Object Segmentation	CodeCode Available	1
A Transductive Approach for Video Object Segmentation	Apr 15, 2020	Instance SegmentationObject	CodeCode Available	1
ActionVOS: Actions as Prompts for Video Object Segmentation	Jul 10, 2024	ObjectReferring Video Object Segmentation	CodeCode Available	1
Learning Motion-Appearance Co-Attention for Zero-Shot Video Object Segmentation	Jan 1, 2021	Semantic SegmentationUnsupervised Video Object Segmentation	CodeCode Available	1
Learning Fast and Robust Target Models for Video Object Segmentation	Feb 27, 2020	One-shot visual object segmentationSegmentation	CodeCode Available	1
Joint Inductive and Transductive Learning for Video Object Segmentation	Aug 8, 2021	Inductive LearningObject	CodeCode Available	1
Learning Motion and Temporal Cues for Unsupervised Video Object Segmentation	Jan 14, 2025	Objectobject-detection	CodeCode Available	1
Learning Object Depth from Camera Motion and Video Object Segmentation	Jul 11, 2020	ObjectSegmentation	CodeCode Available	1
D2Conv3D: Dynamic Dilated Convolutions for Object Segmentation in Videos	Nov 15, 2021	Multi-Object Tracking and SegmentationSegmentation	CodeCode Available	1
D^2Conv3D: Dynamic Dilated Convolutions for Object Segmentation in Videos	Nov 15, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
A Simple and Powerful Global Optimization for Unsupervised Video Object Segmentation	Sep 19, 2022	Clusteringglobal-optimization	CodeCode Available	1
DropMAE: Masked Autoencoders with Spatial-Attention Dropout for Tracking Tasks	Apr 2, 2023	DiversityObject Tracking	CodeCode Available	1
Kernelized Memory Network for Video Object Segmentation	Jul 16, 2020	ObjectSemantic Segmentation	CodeCode Available	1
Accelerating Volumetric Medical Image Annotation via Short-Long Memory SAM 2	May 3, 2025	Computed Tomography (CT)Semantic Segmentation	CodeCode Available	1
Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation	Jun 8, 2022	DenoisingReferring Video Object Segmentation	CodeCode Available	1
DC-SAM: In-Context Segment Anything in Images and Videos via Dual Consistency	Apr 16, 2025	Few-Shot LearningInteractive Segmentation	CodeCode Available	1
Associating Objects with Transformers for Video Object Segmentation	Jun 4, 2021	ObjectOne-shot visual object segmentation	CodeCode Available	1
Integrating Boxes and Masks: A Multi-Object Framework for Unified Visual Tracking and Segmentation	Aug 25, 2023	ObjectObject Tracking	CodeCode Available	1
Interactive Video Object Segmentation Using Global and Local Transfer Modules	Jul 16, 2020	DecoderInteractive Video Object Segmentation	CodeCode Available	1
CrOC: Cross-View Online Clustering for Dense Visual Representation Learning	Mar 23, 2023	ClusteringOnline Clustering	CodeCode Available	1
Delving Deep Into Many-to-Many Attention for Few-Shot Video Object Segmentation	Jun 19, 2021	Meta-LearningSemantic Segmentation	CodeCode Available	1
Delving into the Cyclic Mechanism in Semi-supervised Video Object Segmentation	Oct 23, 2020	ObjectOne-shot visual object segmentation	CodeCode Available	1
Dense Unsupervised Learning for Video Segmentation	Nov 11, 2021	SegmentationSemantic Segmentation	CodeCode Available	1
Depth-aware Test-Time Training for Zero-shot Video Object Segmentation	Mar 7, 2024	Depth EstimationDepth Prediction	CodeCode Available	1
1st Place Solution for YouTubeVOS Challenge 2022: Referring Video Object Segmentation	Dec 27, 2022	ObjectReferring Video Object Segmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 12Next →

All datasets DAVIS 2016 DAVIS 2017 (val)YouTube-VOS 2018 DAVIS-2017 (test-dev)YouTube-VOS 2019 DAVIS 2017 M^3-VOS FBMS YouTube FBMS-59 MOSE SegTrack-v2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	F-Score	94.7	—	Unverified
2	ISVOS (BL30K, MS)	J&F	93.4	—	Unverified
3	XMem (BL30K, MS)	J&F	93.3	—	Unverified
4	BATMAN (val)	J&F	92.5	—	Unverified
5	STCN (val)	J&F	91.6	—	Unverified
6	XMem	J&F	91.5	—	Unverified
7	MobileVOS (val)	J&F	91.4	—	Unverified
8	AOT (val)	J&F	91.1	—	Unverified
9	LCM (val)	J&F	90.7	—	Unverified
10	RPCMVOS (val)	J&F	90.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BLK30K, MS)	Mean Jaccard & F-Measure	89.5	—	Unverified
2	LCM	F-measure	86.5	—	Unverified
3	XMem	Mean Jaccard & F-Measure	86.2	—	Unverified
4	BATMAN	Mean Jaccard & F-Measure	86.2	—	Unverified
5	STCN	Mean Jaccard & F-Measure	85.4	—	Unverified
6	AOT	Mean Jaccard & F-Measure	84.9	—	Unverified
7	STM	F-measure	84.3	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
9	RPCMVOS	Mean Jaccard & F-Measure	83.7	—	Unverified
10	RMN	Mean Jaccard & F-Measure	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	86.9	—	Unverified
2	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
3	RPCMVOS	Mean Jaccard & F-Measure	84	—	Unverified
4	STCN	Mean Jaccard & F-Measure	83	—	Unverified
5	CFBI+	Mean Jaccard & F-Measure	82.8	—	Unverified
6	RMN	Jaccard (Seen)	82.1	—	Unverified
7	LCM	Mean Jaccard & F-Measure	82	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	81.8	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.7	—	Unverified
10	LWL	Mean Jaccard & F-Measure	81.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	83.7	—	Unverified
2	XMem	Mean Jaccard & F-Measure	81	—	Unverified
3	BATMAN	Jaccard	78.4	—	Unverified
4	AOT	Jaccard	75.9	—	Unverified
5	RPCMVOS	Jaccard	75.8	—	Unverified
6	LCM	Jaccard	74.4	—	Unverified
7	KMN	Jaccard	74.1	—	Unverified
8	TransVOS	Jaccard	73	—	Unverified
9	STCN	Jaccard	72.7	—	Unverified
10	RMN	Jaccard	71.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K,MS)	Mean Jaccard & F-Measure	86.8	—	Unverified
2	XMem	Mean Jaccard & F-Measure	85.5	—	Unverified
3	BATMAN	Mean Jaccard & F-Measure	85	—	Unverified
4	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
5	RPCMVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
6	MobileVOS	Mean Jaccard & F-Measure	83.3	—	Unverified
7	STCN	Mean Jaccard & F-Measure	82.7	—	Unverified
8	CFBI+	Mean Jaccard & F-Measure	82.6	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.8	—	Unverified
10	CFBI	Mean Jaccard & F-Measure	81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	Jaccard (Mean)	81.7	—	Unverified
2	ViTAE-T-Stage	Jaccard (Mean)	79.4	—	Unverified
3	DINO (ViT-B/8, ImageNet retrain)	J&F	71.4	—	Unverified
4	VOSwL (Mask+Language)	mIoU	59	—	Unverified
5	UniTrack	mIoU	58.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVOS	Average IOU	75.6	—	Unverified
2	Cutie-base	Average IOU	74.6	—	Unverified
3	XMem	Average IOU	70.4	—	Unverified
4	SAM 2	Average IOU	69.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DFNet	F-Score	82.3	—	Unverified
2	ours	Jaccard (Mean)	76.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours	Average	74.9	—	Unverified
2	FEELVOS	mIoU	0.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	68.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Cutie	J&F	68.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	79.9	—	Unverified