Video Object Segmentation

Video object segmentation is a binary labeling problem aiming to separate foreground object(s) from the background region of a video.

For leaderboards please refer to the different subtasks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 551 papers

Title	Date	Tasks	Status
3D-Aware Instance Segmentation and Tracking in Egocentric Videos	Aug 19, 2024	3D Object ReconstructionInstance Segmentation	—Unverified
UNINEXT-Cutie: The 1st Solution for LSVOS Challenge RVOS Track	Aug 19, 2024	Referring Video Object SegmentationSemantic Segmentation	—Unverified
Fast Sprite Decomposition from Animated Graphics	Aug 7, 2024	Semantic SegmentationVideo Object Segmentation	—Unverified
Biomedical SAM 2: Segment Anything in Biomedical Images and Videos	Aug 6, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available
Strike the Balance: On-the-Fly Uncertainty based User Interactions for Long-Term Video Object Segmentation	Jul 31, 2024	ObjectSegmentation	CodeCode Available
Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video	Jul 22, 2024	DisentanglementKnowledge Distillation	CodeCode Available
Improving Unsupervised Video Object Segmentation via Fake Flow Generation	Jul 16, 2024	Objectobject-detection	—Unverified
Learning Spatial-Semantic Features for Robust Video Object Segmentation	Jul 10, 2024	ObjectSemantic Segmentation	—Unverified
Rethinking Image-to-Video Adaptation: An Object-centric Perspective	Jul 9, 2024	Action RecognitionObject	—Unverified
Submodular video object proposal selection for semantic object segmentation	Jul 8, 2024	ObjectSegmentation	—Unverified
Non-parametric Contextual Relationship Learning for Semantic Video Object Segmentation	Jul 8, 2024	Semantic SegmentationVideo Object Segmentation	—Unverified
Context Propagation from Proposals for Semantic Video Object Segmentation	Jul 8, 2024	ObjectSegmentation	—Unverified
2nd Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation	Jun 20, 2024	Instance SegmentationReferring Video Object Segmentation	—Unverified
Trusted Video Inpainting Localization via Deep Attentive Noise Learning	Jun 19, 2024	Semantic SegmentationVideo Inpainting	CodeCode Available
ViDSOD-100: A New Dataset and a Baseline Model for RGB-D Video Salient Object Detection	Jun 18, 2024	object-detectionObject Detection	CodeCode Available
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation	Jun 18, 2024	Contrastive LearningObject	—Unverified
RMem: Restricted Memory Banks Improve Video Object Segmentation	Jun 12, 2024	ObjectSemantic Segmentation	—Unverified
2nd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation	Jun 12, 2024	Instance SegmentationSemantic Segmentation	—Unverified
Training-Free Robust Interactive Video Object Segmentation	Jun 8, 2024	Interactive Video Object SegmentationObject	—Unverified
3rd Place Solution for MeViS Track in CVPR 2024 PVUW workshop: Motion Expression guided Video Segmentation	Jun 7, 2024	Referring Video Object SegmentationSemantic Segmentation	—Unverified
A Semi-Self-Supervised Approach for Dense-Pattern Video Object Segmentation	Jun 7, 2024	Multi-Task LearningObject	—Unverified
1st Place Solution for MOSE Track in CVPR 2024 PVUW Workshop: Complex Video Object Segmentation	Jun 7, 2024	ObjectSegmentation	—Unverified
3rd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation	Jun 6, 2024	ObjectPosition	—Unverified
Lifelong Learning Using a Dynamically Growing Tree of Sub-networks for Domain Generalization in Video Object Segmentation	May 29, 2024	Domain GeneralizationLifelong learning	—Unverified
One-shot Training for Video Object Segmentation	May 22, 2024	ObjectSemantic Segmentation	—Unverified
Harnessing Vision-Language Pretrained Models with Temporal-Aware Adaptation for Referring Video Object Segmentation	May 17, 2024	Referring Expression SegmentationReferring Video Object Segmentation	—Unverified
Global Motion Understanding in Large-Scale Video Object Segmentation	May 11, 2024	Instance SegmentationOptical Flow Estimation	—Unverified
DeVOS: Flow-Guided Deformable Transformer for Video Object Segmentation	May 11, 2024	Optical Flow EstimationSemantic Segmentation	—Unverified
Space-time Reinforcement Network for Video Object Segmentation	May 7, 2024	ObjectSemantic Segmentation	—Unverified
360VOTS: Visual Object Tracking and Segmentation in Omnidirectional Videos	Apr 22, 2024	ObjectObject Tracking	—Unverified
Spatial-Temporal Multi-level Association for Video Object Segmentation	Apr 9, 2024	ObjectSegmentation	—Unverified
Annolid: Annotate, Segment, and Track Anything You Need	Mar 27, 2024	Instance SegmentationSegmentation	CodeCode Available
OneVOS: Unifying Video Object Segmentation with All-in-One Transformer Framework	Mar 13, 2024	AllManagement	—Unverified
ClickVOS: Click Video Object Segmentation	Mar 10, 2024	ObjectSegmentation	CodeCode Available
Moving Object Proposals with Deep Learned Optical Flow for Video Object Segmentation	Feb 14, 2024	DecoderObject	—Unverified
Point-VOS: Pointing Up Video Object Segmentation	Feb 8, 2024	ObjectSemantic Segmentation	—Unverified
Is Two-shot All You Need? A Label-efficient Approach for Video Segmentation in Breast Ultrasound	Feb 7, 2024	AllLesion Segmentation	—Unverified
Self-supervised Video Object Segmentation with Distillation Learning of Deformable Attention	Jan 25, 2024	Knowledge DistillationObject	—Unverified
Explore Synergistic Interaction Across Frames for Interactive Video Object Segmentation	Jan 23, 2024	Interactive Video Object SegmentationSemantic Segmentation	—Unverified
Understanding Video Transformers via Universal Concept Discovery	Jan 19, 2024	Action RecognitionDecision Making	—Unverified
Learning to Segment Referred Objects from Narrated Egocentric Videos	Jan 1, 2024	ObjectSegmentation	—Unverified
No More Shortcuts: Realizing the Potential of Temporal Self-Supervision	Dec 20, 2023	Action ClassificationAttribute	—Unverified
Hierarchical Graph Pattern Understanding for Zero-Shot VOS	Dec 15, 2023	DecoderGraph Neural Network	CodeCode Available
TAM-VT: Transformation-Aware Multi-scale Video Transformer for Segmentation and Tracking	Dec 13, 2023	Semantic SegmentationVideo Object Segmentation	—Unverified
Semi-supervised Active Learning for Video Action Detection	Dec 12, 2023	Action DetectionActive Learning	CodeCode Available
Flexible visual prompts for in-context learning in computer vision	Dec 11, 2023	Image SegmentationIn-Context Learning	CodeCode Available
VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models	Nov 30, 2023	Semantic SegmentationVideo Editing	—Unverified
SimulFlow: Simultaneously Extracting Feature and Identifying Target for Unsupervised Video Object Segmentation	Nov 30, 2023	Objectobject-detection	—Unverified
Sketch-based Video Object Segmentation: Benchmark and Analysis	Nov 13, 2023	ObjectSegmentation	—Unverified
Learning the What and How of Annotation in Video Object Segmentation	Nov 8, 2023	SegmentationSemantic Segmentation	—Unverified

Show:10 25 50

← PrevPage 6 of 12Next →

All datasets DAVIS 2016 DAVIS 2017 (val)YouTube-VOS 2018 DAVIS-2017 (test-dev)YouTube-VOS 2019 DAVIS 2017 M^3-VOS FBMS YouTube FBMS-59 MOSE SegTrack-v2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	F-Score	94.7	—	Unverified
2	ISVOS (BL30K, MS)	J&F	93.4	—	Unverified
3	XMem (BL30K, MS)	J&F	93.3	—	Unverified
4	BATMAN (val)	J&F	92.5	—	Unverified
5	STCN (val)	J&F	91.6	—	Unverified
6	XMem	J&F	91.5	—	Unverified
7	MobileVOS (val)	J&F	91.4	—	Unverified
8	AOT (val)	J&F	91.1	—	Unverified
9	LCM (val)	J&F	90.7	—	Unverified
10	RPCMVOS (val)	J&F	90.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BLK30K, MS)	Mean Jaccard & F-Measure	89.5	—	Unverified
2	LCM	F-measure	86.5	—	Unverified
3	XMem	Mean Jaccard & F-Measure	86.2	—	Unverified
4	BATMAN	Mean Jaccard & F-Measure	86.2	—	Unverified
5	STCN	Mean Jaccard & F-Measure	85.4	—	Unverified
6	AOT	Mean Jaccard & F-Measure	84.9	—	Unverified
7	STM	F-measure	84.3	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
9	RPCMVOS	Mean Jaccard & F-Measure	83.7	—	Unverified
10	RMN	Mean Jaccard & F-Measure	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	86.9	—	Unverified
2	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
3	RPCMVOS	Mean Jaccard & F-Measure	84	—	Unverified
4	STCN	Mean Jaccard & F-Measure	83	—	Unverified
5	CFBI+	Mean Jaccard & F-Measure	82.8	—	Unverified
6	RMN	Jaccard (Seen)	82.1	—	Unverified
7	LCM	Mean Jaccard & F-Measure	82	—	Unverified
8	TransVOS	Mean Jaccard & F-Measure	81.8	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.7	—	Unverified
10	LWL	Mean Jaccard & F-Measure	81.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K, MS)	Mean Jaccard & F-Measure	83.7	—	Unverified
2	XMem	Mean Jaccard & F-Measure	81	—	Unverified
3	BATMAN	Jaccard	78.4	—	Unverified
4	AOT	Jaccard	75.9	—	Unverified
5	RPCMVOS	Jaccard	75.8	—	Unverified
6	LCM	Jaccard	74.4	—	Unverified
7	KMN	Jaccard	74.1	—	Unverified
8	TransVOS	Jaccard	73	—	Unverified
9	STCN	Jaccard	72.7	—	Unverified
10	RMN	Jaccard	71.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	XMem (BL30K,MS)	Mean Jaccard & F-Measure	86.8	—	Unverified
2	XMem	Mean Jaccard & F-Measure	85.5	—	Unverified
3	BATMAN	Mean Jaccard & F-Measure	85	—	Unverified
4	AOT	Mean Jaccard & F-Measure	84.1	—	Unverified
5	RPCMVOS	Mean Jaccard & F-Measure	83.9	—	Unverified
6	MobileVOS	Mean Jaccard & F-Measure	83.3	—	Unverified
7	STCN	Mean Jaccard & F-Measure	82.7	—	Unverified
8	CFBI+	Mean Jaccard & F-Measure	82.6	—	Unverified
9	SST	Mean Jaccard & F-Measure	81.8	—	Unverified
10	CFBI	Mean Jaccard & F-Measure	81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AOC-MF (val)	Jaccard (Mean)	81.7	—	Unverified
2	ViTAE-T-Stage	Jaccard (Mean)	79.4	—	Unverified
3	DINO (ViT-B/8, ImageNet retrain)	J&F	71.4	—	Unverified
4	VOSwL (Mask+Language)	mIoU	59	—	Unverified
5	UniTrack	mIoU	58.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVOS	Average IOU	75.6	—	Unverified
2	Cutie-base	Average IOU	74.6	—	Unverified
3	XMem	Average IOU	70.4	—	Unverified
4	SAM 2	Average IOU	69.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DFNet	F-Score	82.3	—	Unverified
2	ours	Jaccard (Mean)	76.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ours	Average	74.9	—	Unverified
2	FEELVOS	mIoU	0.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	68.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Cutie	J&F	68.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LOCATE	mIoU	79.9	—	Unverified