Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 107 papers

Title	Date	Tasks	Status	Hype
Hybrid Transformers for Music Source Separation	Nov 15, 2022	Music Source SeparationSpeech Enhancement	CodeCode Available	5
The Whole Is Greater than the Sum of Its Parts: Improving Music Source Separation by Bridging Network	May 13, 2023	Music Source Separation	CodeCode Available	4
Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation	Sep 20, 2018	Multi-task Audio Source SeperationMusic Source Separation	CodeCode Available	3
Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)	Sep 15, 2023	Music Source Separation	CodeCode Available	2
A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems	Jun 26, 2024	Audio Source SeparationDecoder	CodeCode Available	2
Training-Free Multi-Step Audio Source Separation	May 26, 2025	Audio Source SeparationDenoising	CodeCode Available	2
Pre-training Music Classification Models via Music Source Separation	Oct 24, 2023	ClassificationGenre classification	CodeCode Available	2
SCNet: Sparse Compression Network for Music Source Separation	Jan 24, 2024	CPUMusic Source Separation	CodeCode Available	2
All for One and One for All: Improving Music Separation by Bridging Networks	Oct 8, 2020	AllMusic Source Separation	CodeCode Available	2
The Sound Demixing Challenge 2023 x2013 Music Demixing Track	Aug 14, 2023	Music Source Separation	CodeCode Available	2
LaSAFT: Latent Source Attentive Frequency Transformation for Conditioned Source Separation	Oct 22, 2020	Music Source Separation	CodeCode Available	1
Meta-learning Extractors for Music Source Separation	Feb 17, 2020	Meta-LearningMusic Source Separation	CodeCode Available	1
A fully differentiable model for unsupervised singing voice separation	Jan 30, 2024	Music Source Separation	CodeCode Available	1
Wave-U-Net: A Multi-Scale Neural Network for End-to-End Audio Source Separation	Jun 8, 2018	Audio Source SeparationMusic Source Separation	CodeCode Available	1
MedleyVox: An Evaluation Dataset for Multiple Singing Voices Separation	Nov 14, 2022	Music Source SeparationSuper-Resolution	CodeCode Available	1
KUIELab-MDX-Net: A Two-Stream Neural Network for Music Demixing	Nov 24, 2021	Music Source SeparationVocal Bursts Valence Prediction	CodeCode Available	1
Transfer Learning with Jukebox for Music Source Separation	Nov 28, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	1
SynthSOD: Developing an Heterogeneous Dataset for Orchestra Music Source Separation	Sep 17, 2024	Music Source Separation	CodeCode Available	1
Danna-Sep: Unite to separate them all	Dec 7, 2021	AllMusic Source Separation	CodeCode Available	1
Spleeter: A Fast And State-of-the Art Music Source Separation Tool With Pre-trained Models	Nov 4, 2019	GPUMusic Source Separation	CodeCode Available	1
Multi-Task Audio Source Separation	Jul 14, 2021	Audio Source SeparationMulti-task Audio Source Seperation	CodeCode Available	1
Time-Domain Audio Source Separation Based on Wave-U-Net Combined with Discrete Wavelet Transform	Jan 28, 2020	Audio Source SeparationMusic Source Separation	CodeCode Available	1
Unsupervised Source Separation via Bayesian Inference in the Latent Domain	Oct 11, 2021	Audio Source SeparationBayesian Inference	CodeCode Available	1
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices	Apr 5, 2022	Audio-Visual SynchronizationMusic Source Separation	CodeCode Available	1
A Unified Model for Zero-shot Music Source Separation, Transcription and Synthesis	Aug 7, 2021	DecoderDisentanglement	CodeCode Available	1
End-to-end music source separation: is it possible in the waveform domain?	Oct 29, 2018	Deep LearningMusic Source Separation	CodeCode Available	1
Unsupervised Music Source Separation Using Differentiable Parametric Source Models	Jan 24, 2022	Audio Source SeparationDeep Learning	CodeCode Available	1
Quantifying Spatial Audio Quality Impairment	Jun 13, 2023	Audio CompressionMusic Source Separation	CodeCode Available	1
Music Source Separation with Generative Flow	Apr 19, 2022	Music Source Separation	CodeCode Available	1
CWS-PResUNet: Music Source Separation with Channel-wise Subband Phase-aware ResUNet	Dec 9, 2021	Music Source Separation	CodeCode Available	1
Music Demixing Challenge 2021	Aug 31, 2021	Music Source Separation	CodeCode Available	1
A cappella: Audio-visual Singing Voice Separation	Apr 20, 2021	Music Source SeparationSpeech Separation	CodeCode Available	1
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1
Mixing-Specific Data Augmentation Techniques for Improved Blind Violin/Piano Source Separation	Aug 6, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1
Multi-channel U-Net for Music Source Separation	Mar 23, 2020	Music Source Separation	CodeCode Available	1
Music Source Restoration	May 27, 2025	Music Source Separation	CodeCode Available	1
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1
Music Source Separation with Band-split RNN	Sep 30, 2022	Music Source Separation	CodeCode Available	1
Unsupervised Interpretable Representation Learning for Singing Voice Separation	Mar 3, 2020	DenoisingMusic Source Separation	CodeCode Available	1
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3	Jun 15, 2023	Music Source Separation	CodeCode Available	1
Fast accuracy estimation of deep learning based multi-class musical source separation	Oct 19, 2020	Audio Source SeparationMusic Source Separation	—Unverified	0
Examining the Mapping Functions of Denoising Autoencoders in Singing Voice Separation	Apr 12, 2019	DecoderDenoising	—Unverified	0
Class-conditional embeddings for music source separation	Nov 7, 2018	ClusteringDeep Clustering	—Unverified	0
End-to-End Sound Source Separation Conditioned On Instrument Labels	Nov 5, 2018	Music Source Separation	—Unverified	0
Bootstrapping deep music separation from primitive auditory grouping principles	Oct 23, 2019	Music Source Separation	—Unverified	0
A Hands-on Comparison of DNNs for Dialog Separation Using Transfer Learning from Music Source Separation	Jun 16, 2021	Music Source SeparationTransfer Learning	—Unverified	0
Dilated Convolution with Dilated GRU for Music Source Separation	Jun 4, 2019	Music Source Separation	—Unverified	0
Depthwise Separable Convolutions Versus Recurrent Neural Networks for Monaural Singing Voice Separation	Jul 6, 2020	Music Source Separation	—Unverified	0
MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement	Oct 6, 2023	Music Source SeparationSpeech Enhancement	—Unverified	0
Densely connected multidilated convolutional networks for dense prediction tasks	Nov 21, 2020	Audio Source SeparationMusic Source Separation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified