Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 107 papers

Title	Date	Tasks	Status	Hype
End-to-end music source separation: is it possible in the waveform domain?	Oct 29, 2018	Deep LearningMusic Source Separation	CodeCode Available	1
Unsupervised Music Source Separation Using Differentiable Parametric Source Models	Jan 24, 2022	Audio Source SeparationDeep Learning	CodeCode Available	1
Quantifying Spatial Audio Quality Impairment	Jun 13, 2023	Audio CompressionMusic Source Separation	CodeCode Available	1
Music Source Separation with Generative Flow	Apr 19, 2022	Music Source Separation	CodeCode Available	1
CWS-PResUNet: Music Source Separation with Channel-wise Subband Phase-aware ResUNet	Dec 9, 2021	Music Source Separation	CodeCode Available	1
Music Demixing Challenge 2021	Aug 31, 2021	Music Source Separation	CodeCode Available	1
A cappella: Audio-visual Singing Voice Separation	Apr 20, 2021	Music Source SeparationSpeech Separation	CodeCode Available	1
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1
Mixing-Specific Data Augmentation Techniques for Improved Blind Violin/Piano Source Separation	Aug 6, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1
Multi-channel U-Net for Music Source Separation	Mar 23, 2020	Music Source Separation	CodeCode Available	1
Music Source Restoration	May 27, 2025	Music Source Separation	CodeCode Available	1
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1
Music Source Separation with Band-split RNN	Sep 30, 2022	Music Source Separation	CodeCode Available	1
Unsupervised Interpretable Representation Learning for Singing Voice Separation	Mar 3, 2020	DenoisingMusic Source Separation	CodeCode Available	1
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3	Jun 15, 2023	Music Source Separation	CodeCode Available	1
Fast accuracy estimation of deep learning based multi-class musical source separation	Oct 19, 2020	Audio Source SeparationMusic Source Separation	—Unverified	0
Examining the Mapping Functions of Denoising Autoencoders in Singing Voice Separation	Apr 12, 2019	DecoderDenoising	—Unverified	0
Class-conditional embeddings for music source separation	Nov 7, 2018	ClusteringDeep Clustering	—Unverified	0
End-to-End Sound Source Separation Conditioned On Instrument Labels	Nov 5, 2018	Music Source Separation	—Unverified	0
Bootstrapping deep music separation from primitive auditory grouping principles	Oct 23, 2019	Music Source Separation	—Unverified	0
A Hands-on Comparison of DNNs for Dialog Separation Using Transfer Learning from Music Source Separation	Jun 16, 2021	Music Source SeparationTransfer Learning	—Unverified	0
Dilated Convolution with Dilated GRU for Music Source Separation	Jun 4, 2019	Music Source Separation	—Unverified	0
Depthwise Separable Convolutions Versus Recurrent Neural Networks for Monaural Singing Voice Separation	Jul 6, 2020	Music Source Separation	—Unverified	0
MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement	Oct 6, 2023	Music Source SeparationSpeech Enhancement	—Unverified	0
Densely connected multidilated convolutional networks for dense prediction tasks	Nov 21, 2020	Audio Source SeparationMusic Source Separation	—Unverified	0

Show:10 25 50

← PrevPage 2 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified