Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 107 papers

Title	Date	Tasks	Status	Hype
D3Net: Densely connected multidilated DenseNet for music source separation	Oct 5, 2020	Music Source Separation	CodeCode Available	0
A frugal approach to music source separation	Oct 2, 2020	Music Source Separation	—Unverified	0
Mixing-Specific Data Augmentation Techniques for Improved Blind Violin/Piano Source Separation	Aug 6, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1
Multitask learning for instrument activation aware music source separation	Aug 3, 2020	Information RetrievalMusic Information Retrieval	—Unverified	0
Depthwise Separable Convolutions Versus Recurrent Neural Networks for Monaural Singing Voice Separation	Jul 6, 2020	Music Source Separation	—Unverified	0
Multi-channel U-Net for Music Source Separation	Mar 23, 2020	Music Source Separation	CodeCode Available	1
Voice and accompaniment separation in music using self-attention convolutional neural network	Mar 19, 2020	Music Source Separation	—Unverified	0
Unsupervised Interpretable Representation Learning for Singing Voice Separation	Mar 3, 2020	DenoisingMusic Source Separation	CodeCode Available	1
Meta-learning Extractors for Music Source Separation	Feb 17, 2020	Meta-LearningMusic Source Separation	CodeCode Available	1
Time-Domain Audio Source Separation Based on Wave-U-Net Combined with Discrete Wavelet Transform	Jan 28, 2020	Audio Source SeparationMusic Source Separation	CodeCode Available	1
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified	0
Spleeter: A Fast And State-of-the Art Music Source Separation Tool With Pre-trained Models	Nov 4, 2019	GPUMusic Source Separation	CodeCode Available	1
Bootstrapping deep music separation from primitive auditory grouping principles	Oct 23, 2019	Music Source Separation	—Unverified	0
Cutting Music Source Separation Some Slakh: A Dataset to Study the Impact of Training Data Quality and Quantity	Sep 18, 2019	Data AugmentationMusic Source Separation	—Unverified	0
Sams-Net: A Sliced Attention-based Neural Network for Music Source Separation	Sep 12, 2019	Audio Source SeparationMusic Source Separation	CodeCode Available	0
Open-Unmix - A Reference Implementation for Music Source Separation	Sep 8, 2019	Music Source Separation	CodeCode Available	0
Demucs: Deep Extractor for Music Sources with extra unlabeled data remixed	Sep 3, 2019	Music Source Separation	—Unverified	0
Dilated Convolution with Dilated GRU for Music Source Separation	Jun 4, 2019	Music Source Separation	—Unverified	0
Examining the Mapping Functions of Denoising Autoencoders in Singing Voice Separation	Apr 12, 2019	DecoderDenoising	—Unverified	0
Spectrogram Feature Losses for Music Source Separation	Jan 15, 2019	Deep LearningMusic Source Separation	—Unverified	0
Semi-Supervised Monaural Singing Voice Separation With a Masking Network Trained on Synthetic Mixtures	Dec 14, 2018	Music Source SeparationSpeech Separation	CodeCode Available	0
Class-conditional embeddings for music source separation	Nov 7, 2018	ClusteringDeep Clustering	—Unverified	0
End-to-End Sound Source Separation Conditioned On Instrument Labels	Nov 5, 2018	Music Source Separation	—Unverified	0
End-to-end music source separation: is it possible in the waveform domain?	Oct 29, 2018	Deep LearningMusic Source Separation	CodeCode Available	1
Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation	Sep 20, 2018	Multi-task Audio Source SeperationMusic Source Separation	CodeCode Available	3

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified