Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 107 papers

Title	Date	Tasks	Status
A Hands-on Comparison of DNNs for Dialog Separation Using Transfer Learning from Music Source Separation	Jun 16, 2021	Music Source SeparationTransfer Learning	—Unverified
An Ensemble Approach to Music Source Separation: A Comparative Analysis of Conventional and Hierarchical Stem Separation	Oct 28, 2024	Music Source Separation	—Unverified
A Study of Transfer Learning in Music Source Separation	Oct 23, 2020	Audio Source SeparationData Augmentation	—Unverified
Bootstrapping deep music separation from primitive auditory grouping principles	Oct 23, 2019	Music Source Separation	—Unverified
Class-conditional embeddings for music source separation	Nov 7, 2018	ClusteringDeep Clustering	—Unverified
Contrastive Learning based Deep Latent Masking for Music Source Separation	Aug 20, 2023	Contrastive LearningMusic Source Separation	—Unverified
Cutting Music Source Separation Some Slakh: A Dataset to Study the Impact of Training Data Quality and Quantity	Sep 18, 2019	Data AugmentationMusic Source Separation	—Unverified
Deep Clustering and Conventional Networks for Music Separation: Stronger Together	Nov 18, 2016	ClusteringDeep Clustering	—Unverified
Demucs: Deep Extractor for Music Sources with extra unlabeled data remixed	Sep 3, 2019	Music Source Separation	—Unverified
Denoising Auto-encoder with Recurrent Skip Connections and Residual Regression for Music Source Separation	Jul 5, 2018	ARCDenoising	—Unverified
Densely connected multidilated convolutional networks for dense prediction tasks	Nov 21, 2020	Audio Source SeparationMusic Source Separation	—Unverified
Depthwise Separable Convolutions Versus Recurrent Neural Networks for Monaural Singing Voice Separation	Jul 6, 2020	Music Source Separation	—Unverified
Dilated Convolution with Dilated GRU for Music Source Separation	Jun 4, 2019	Music Source Separation	—Unverified
End-to-End Sound Source Separation Conditioned On Instrument Labels	Nov 5, 2018	Music Source Separation	—Unverified
Examining the Mapping Functions of Denoising Autoencoders in Singing Voice Separation	Apr 12, 2019	DecoderDenoising	—Unverified
Fast accuracy estimation of deep learning based multi-class musical source separation	Oct 19, 2020	Audio Source SeparationMusic Source Separation	—Unverified
Feature-informed Latent Space Regularization for Music Source Separation	Mar 17, 2022	Multi-Task LearningMusic Source Separation	—Unverified
Hierarchic Temporal Convolutional Network With Cross-Domain Encoder for Music Source Separation	Jun 30, 2022	Audio Source SeparationMusic Source Separation	—Unverified
HTMD-Net: A Hybrid Masking-Denoising Approach to Time-Domain Monaural Singing Voice Separation	Mar 7, 2021	Computational EfficiencyDenoising	—Unverified
Hybrid Spectrogram and Waveform Source Separation	Nov 5, 2021	Music Source Separation	—Unverified
Hybrid Y-Net Architecture for Singing Voice Separation	Mar 5, 2023	Music Source Separation	—Unverified
Improving Real-Time Music Accompaniment Separation with MMDenseNet	Jun 30, 2024	Music Source Separation	—Unverified
Is MixIT Really Unsuitable for Correlated Sources? Exploring MixIT for Unsupervised Pre-training in Music Source Separation	May 12, 2025	Music Source SeparationUnsupervised Pre-training	—Unverified
Jointist: Simultaneous Improvement of Multi-instrument Transcription and Music Source Separation via Joint Training	Feb 1, 2023	Chord RecognitionInstrument Recognition	—Unverified
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation	Jan 7, 2025	Information RetrievalMusic Information Retrieval	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified