Video Object Segmentation

Video object segmentation is a binary labeling problem aiming to separate foreground object(s) from the background region of a video.

For leaderboards please refer to the different subtasks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 551 papers

Title	Date	Tasks	Status	Hype	Score
Isomer: Isomerous Transformer for Zero-shot Video Object Segmentation	Aug 13, 2023	Semantic SegmentationVideo Object Segmentation	CodeCode Available	1	5
Autoencoder-based background reconstruction and foreground segmentation with background noise estimation	Dec 15, 2021	Foreground SegmentationSegmentation	CodeCode Available	1	5
Learning Dynamic Network Using a Reuse Gate Function in Semi-supervised Video Object Segmentation	Dec 21, 2020	One-shot visual object segmentationSegmentation	CodeCode Available	1	5
BubbleNets: Learning to Select the Guidance Frame in Video Object Segmentation by Deep Sorting Frames	Mar 28, 2019	SegmentationSemantic Segmentation	CodeCode Available	0	5
Efficient Video Object Segmentation via Network Modulation	Feb 4, 2018	ObjectSegmentation	CodeCode Available	0	5
Temporal Transductive Inference for Few-Shot Video Object Segmentation	Mar 27, 2022	Meta-LearningObject	CodeCode Available	0	5
ThinkVideo: High-Quality Reasoning Video Segmentation with Chain of Thoughts	May 24, 2025	Image SegmentationInstance Segmentation	CodeCode Available	0	5
LSMVOS: Long-Short-Term Similarity Matching for Video Object	Sep 2, 2020	ObjectOptical Flow Estimation	CodeCode Available	0	5
LOCATE: Self-supervised Object Discovery via Flow-guided Graph-cut and Bootstrapped Self-training	Aug 22, 2023	ObjectObject Discovery	CodeCode Available	0	5
Sub-token ViT Embedding via Stochastic Resonance Transformers	Oct 6, 2023	Depth EstimationDepth Prediction	CodeCode Available	0	5
Box Supervised Video Segmentation Proposal Network	Feb 14, 2022	Image SegmentationMotion Compensation	CodeCode Available	0	5
Spatiotemporal CNN for Video Object Segmentation	Apr 4, 2019	ObjectSegmentation	CodeCode Available	0	5
Adaptive Temporal Encoding Network for Video Instance-level Human Parsing	Aug 2, 2018	Human ParsingSegmentation	CodeCode Available	0	5
Learning Video Object Segmentation from Static Images	Dec 8, 2016	Instance SegmentationObject	CodeCode Available	0	5
Learning Unsupervised Video Object Segmentation Through Visual Attention	Jun 1, 2019	ObjectSegmentation	CodeCode Available	0	5
Shifting More Attention to Video Salient Object Detection	Jun 1, 2019	Objectobject-detection	CodeCode Available	0	5
Boosting Video Object Segmentation based on Scale Inconsistency	May 2, 2022	ObjectSemantic Segmentation	CodeCode Available	0	5
Semi-supervised Active Learning for Video Action Detection	Dec 12, 2023	Action DetectionActive Learning	CodeCode Available	0	5
Siamese Network with Interactive Transformer for Video Object Segmentation	Dec 28, 2021	DecoderObject	CodeCode Available	0	5
Adaptive ROI Generation for Video Object Segmentation Using Reinforcement Learning	Sep 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0	5
Stable Mean Teacher for Semi-supervised Video Action Detection	Dec 10, 2024	Action DetectionSemantic Segmentation	CodeCode Available	0	5
Self-supervised Amodal Video Object Segmentation	Oct 23, 2022	ObjectSegmentation	CodeCode Available	0	5
DMM-Net: Differentiable Mask-Matching Network for Video Object Segmentation	Sep 27, 2019	ObjectOne-shot visual object segmentation	CodeCode Available	0	5
Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video	Jul 22, 2024	DisentanglementKnowledge Distillation	CodeCode Available	0	5
Discriminative Spatial-Semantic VOS Solution: 1st Place Solution for 6th LSVOS	Aug 29, 2024	ObjectObject Recognition	CodeCode Available	0	5
Learning Cross-Modal Affinity for Referring Video Object Segmentation Targeting Limited Samples	Sep 5, 2023	Referring Video Object SegmentationSemantic Segmentation	CodeCode Available	0	5
Learning Correspondence from the Cycle-Consistency of Time	Mar 18, 2019	Optical Flow EstimationSemantic Segmentation	CodeCode Available	0	5
Strike the Balance: On-the-Fly Uncertainty based User Interactions for Long-Term Video Object Segmentation	Jul 31, 2024	ObjectSegmentation	CodeCode Available	0	5
SegFlow: Joint Learning for Video Object Segmentation and Optical Flow	Sep 20, 2017	Image SegmentationObject	CodeCode Available	0	5
Separable Structure Modeling for Semi-supervised Video Object Segmentation	Feb 18, 2021	ObjectOne-shot visual object segmentation	CodeCode Available	0	5
Adaptive Memory Management for Video Object Segmentation	Apr 13, 2022	ManagementObject	CodeCode Available	0	5
Self-supervised Video Object Segmentation	Jun 22, 2020	ObjectOne-shot visual object segmentation	CodeCode Available	0	5
Revisiting Sequence-to-Sequence Video Object Segmentation with Multi-Task Loss and Skip-Memory	Apr 25, 2020	DecoderObject	CodeCode Available	0	5
DTOS: Dynamic Time Object Sensing with Large Multimodal Model	Jan 1, 2025	Moment RetrievalReferring Video Object Segmentation	CodeCode Available	0	5
Revisiting Click-based Interactive Video Object Segmentation	Mar 3, 2022	Interactive Video Object SegmentationObject	CodeCode Available	0	5
RVOS: End-to-End Recurrent Network for Video Object Segmentation	Mar 13, 2019	GPUObject	CodeCode Available	0	5
Reducing Annotation Burden: Exploiting Image Knowledge for Few-Shot Medical Video Object Segmentation via Spatiotemporal Consistency Relearning	Mar 19, 2025	SegmentationSemantic Segmentation	CodeCode Available	0	5
ReferDINO-Plus: 2nd Solution for 4th PVUW MeViS Challenge at CVPR 2025	Mar 30, 2025	ObjectReferring Video Object Segmentation	CodeCode Available	0	5
Adaptive Masked Proxies for Few-Shot Segmentation	Feb 19, 2019	Continual LearningFew-Shot Semantic Segmentation	CodeCode Available	0	5
Implicit Motion-Compensated Network for Unsupervised Video Object Segmentation	Apr 6, 2022	Motion CompensationSemantic Segmentation	CodeCode Available	0	5
Deep Extreme Cut: From Extreme Points to Object Segmentation	Nov 24, 2017	Instance SegmentationInteractive Segmentation	CodeCode Available	0	5
RANet: Ranking Attention Network for Fast Video Object Segmentation	Aug 19, 2019	DecoderObject	CodeCode Available	0	5
Illumination-Based Data Augmentation for Robust Background Subtraction	Oct 18, 2019	Data AugmentationForeground Segmentation	CodeCode Available	0	5
Hybrid-S2S: Video Object Segmentation with Recurrent Networks and Correspondence Matching	Oct 10, 2020	One-shot visual object segmentationSegmentation	CodeCode Available	0	5
READMem: Robust Embedding Association for a Diverse Memory in Unconstrained Video Object Segmentation	May 22, 2023	Semantic SegmentationSemi-Supervised Video Object Segmentation	CodeCode Available	0	5
Ground-truth or DAER: Selective Re-query of Secondary Information	Sep 16, 2020	Object TrackingScene Classification	CodeCode Available	0	5
Holistic Prototype Attention Network for Few-Shot VOS	Jul 16, 2023	Graph AttentionSemantic Segmentation	CodeCode Available	0	5
Proposal, Tracking and Segmentation (PTS): A Cascaded Network for Video Object Segmentation	Jul 2, 2019	ObjectObject Tracking	CodeCode Available	0	5
Lucid Data Dreaming for Video Object Segmentation	Mar 28, 2017	Multiple Object TrackingObject	CodeCode Available	0	5
A 3D Convolutional Approach to Spectral Object Segmentation in Space and Time	Jul 5, 2019	ClusteringGPU	CodeCode Available	0	5

Show:10 25 50

← PrevPage 5 of 12Next →

All datasets DAVIS 2016 DAVIS 2017 (val)YouTube-VOS 2018 DAVIS-2017 (test-dev)YouTube-VOS 2019 DAVIS 2017 M^3-VOS FBMS YouTube FBMS-59 MOSE SegTrack-v2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	F-Score	94.7	—	Unverified
2	ISVOS (BL30K, MS)	J&F	93.4	—	Unverified
3	XMem (BL30K, MS)	J&F	93.3	—	Unverified
4	BATMAN (val)	J&F	92.5	—	Unverified
5	STCN (val)	J&F	91.6	—	Unverified
6	XMem	J&F	91.5	—	Unverified
7	MobileVOS (val)	J&F	91.4	—	Unverified
8	AOT (val)	J&F	91.1	—	Unverified
9	LCM (val)	J&F	90.7	—	Unverified
10	RPCMVOS (val)	J&F	90.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BLK30K, MS)	Mean Jaccard & F-Measure	89.5	—	Unverified
2	LCM	F-measure	86.5	—	Unverified
3	XMem	Mean Jaccard & F-Measure	86.2	—	Unverified
4	BATMAN	Mean Jaccard & F-Measure	86.2	—	Unverified
5	STCN	Mean Jaccard & F-Measure	85.4	—	Unverified
6	AOT	Mean Jaccard & F-Measure	84.9	—	Unverified
7	STM	F-measure	84.3	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
9	RPCMVOS	Mean Jaccard & F-Measure	83.7	—	Unverified
10	RMN	Mean Jaccard & F-Measure	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	86.9	—	Unverified
2	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
3	RPCMVOS	Mean Jaccard & F-Measure	84	—	Unverified
4	STCN	Mean Jaccard & F-Measure	83	—	Unverified
5	CFBI+	Mean Jaccard & F-Measure	82.8	—	Unverified
6	RMN	Jaccard (Seen)	82.1	—	Unverified
7	LCM	Mean Jaccard & F-Measure	82	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	81.8	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.7	—	Unverified
10	LWL	Mean Jaccard & F-Measure	81.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	83.7	—	Unverified
2	XMem	Mean Jaccard & F-Measure	81	—	Unverified
3	BATMAN	Jaccard	78.4	—	Unverified
4	AOT	Jaccard	75.9	—	Unverified
5	RPCMVOS	Jaccard	75.8	—	Unverified
6	LCM	Jaccard	74.4	—	Unverified
7	KMN	Jaccard	74.1	—	Unverified
8	TransVOS	Jaccard	73	—	Unverified
9	STCN	Jaccard	72.7	—	Unverified
10	RMN	Jaccard	71.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K,MS)	Mean Jaccard & F-Measure	86.8	—	Unverified
2	XMem	Mean Jaccard & F-Measure	85.5	—	Unverified
3	BATMAN	Mean Jaccard & F-Measure	85	—	Unverified
4	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
5	RPCMVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
6	MobileVOS	Mean Jaccard & F-Measure	83.3	—	Unverified
7	STCN	Mean Jaccard & F-Measure	82.7	—	Unverified
8	CFBI+	Mean Jaccard & F-Measure	82.6	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.8	—	Unverified
10	CFBI	Mean Jaccard & F-Measure	81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	Jaccard (Mean)	81.7	—	Unverified
2	ViTAE-T-Stage	Jaccard (Mean)	79.4	—	Unverified
3	DINO (ViT-B/8, ImageNet retrain)	J&F	71.4	—	Unverified
4	VOSwL (Mask+Language)	mIoU	59	—	Unverified
5	UniTrack	mIoU	58.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVOS	Average IOU	75.6	—	Unverified
2	Cutie-base	Average IOU	74.6	—	Unverified
3	XMem	Average IOU	70.4	—	Unverified
4	SAM 2	Average IOU	69.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DFNet	F-Score	82.3	—	Unverified
2	ours	Jaccard (Mean)	76.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours	Average	74.9	—	Unverified
2	FEELVOS	mIoU	0.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	68.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Cutie	J&F	68.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	79.9	—	Unverified