Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 107 papers

Title	Date	Tasks	Status	Hype
Hybrid Transformers for Music Source Separation	Nov 15, 2022	Music Source SeparationSpeech Enhancement	CodeCode Available	5
The Whole Is Greater than the Sum of Its Parts: Improving Music Source Separation by Bridging Network	May 13, 2023	Music Source Separation	CodeCode Available	4
Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation	Sep 20, 2018	Multi-task Audio Source SeperationMusic Source Separation	CodeCode Available	3
Training-Free Multi-Step Audio Source Separation	May 26, 2025	Audio Source SeparationDenoising	CodeCode Available	2
A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems	Jun 26, 2024	Audio Source SeparationDecoder	CodeCode Available	2
SCNet: Sparse Compression Network for Music Source Separation	Jan 24, 2024	CPUMusic Source Separation	CodeCode Available	2
Pre-training Music Classification Models via Music Source Separation	Oct 24, 2023	ClassificationGenre classification	CodeCode Available	2
Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)	Sep 15, 2023	Music Source Separation	CodeCode Available	2
The Sound Demixing Challenge 2023 x2013 Music Demixing Track	Aug 14, 2023	Music Source Separation	CodeCode Available	2
All for One and One for All: Improving Music Separation by Bridging Networks	Oct 8, 2020	AllMusic Source Separation	CodeCode Available	2
Music Source Restoration	May 27, 2025	Music Source Separation	CodeCode Available	1
SynthSOD: Developing an Heterogeneous Dataset for Orchestra Music Source Separation	Sep 17, 2024	Music Source Separation	CodeCode Available	1
A fully differentiable model for unsupervised singing voice separation	Jan 30, 2024	Music Source Separation	CodeCode Available	1
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3	Jun 15, 2023	Music Source Separation	CodeCode Available	1
Quantifying Spatial Audio Quality Impairment	Jun 13, 2023	Audio CompressionMusic Source Separation	CodeCode Available	1
MedleyVox: An Evaluation Dataset for Multiple Singing Voices Separation	Nov 14, 2022	Music Source SeparationSuper-Resolution	CodeCode Available	1
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1
Music Source Separation with Band-split RNN	Sep 30, 2022	Music Source Separation	CodeCode Available	1
Music Source Separation with Generative Flow	Apr 19, 2022	Music Source Separation	CodeCode Available	1
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices	Apr 5, 2022	Audio-Visual SynchronizationMusic Source Separation	CodeCode Available	1
Unsupervised Music Source Separation Using Differentiable Parametric Source Models	Jan 24, 2022	Audio Source SeparationDeep Learning	CodeCode Available	1
CWS-PResUNet: Music Source Separation with Channel-wise Subband Phase-aware ResUNet	Dec 9, 2021	Music Source Separation	CodeCode Available	1
Danna-Sep: Unite to separate them all	Dec 7, 2021	AllMusic Source Separation	CodeCode Available	1
Transfer Learning with Jukebox for Music Source Separation	Nov 28, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified