Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 107 papers

Title	Date	Tasks	Status
Sampling-Frequency-Independent Audio Source Separation Using Convolution Layer Based on Impulse Invariant Method	May 10, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available
HTMD-Net: A Hybrid Masking-Denoising Approach to Time-Domain Monaural Singing Voice Separation	Mar 7, 2021	Computational EfficiencyDenoising	—Unverified
Music source separation conditioned on 3D point clouds	Feb 3, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available
Adversarial Unsupervised Domain Adaptation for Harmonic-Percussive Source Separation	Jan 3, 2021	Domain AdaptationMusic Source Separation	—Unverified
Source Separation and Depthwise Separable Convolutions for Computer Audition	Dec 6, 2020	Music Source SeparationRepresentation Learning	—Unverified
Densely connected multidilated convolutional networks for dense prediction tasks	Nov 21, 2020	Audio Source SeparationMusic Source Separation	CodeCode Available
A Study of Transfer Learning in Music Source Separation	Oct 23, 2020	Audio Source SeparationData Augmentation	—Unverified
Transcription Is All You Need: Learning to Separate Musical Mixtures with Score as Supervision	Oct 22, 2020	AllMusic Source Separation	—Unverified
Fast accuracy estimation of deep learning based multi-class musical source separation	Oct 19, 2020	Audio Source SeparationMusic Source Separation	—Unverified
D3Net: Densely connected multidilated DenseNet for music source separation	Oct 5, 2020	Music Source Separation	CodeCode Available
A frugal approach to music source separation	Oct 2, 2020	Music Source Separation	—Unverified
Multitask learning for instrument activation aware music source separation	Aug 3, 2020	Information RetrievalMusic Information Retrieval	—Unverified
Depthwise Separable Convolutions Versus Recurrent Neural Networks for Monaural Singing Voice Separation	Jul 6, 2020	Music Source Separation	—Unverified
Voice and accompaniment separation in music using self-attention convolutional neural network	Mar 19, 2020	Music Source Separation	—Unverified
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	CodeCode Available
Bootstrapping deep music separation from primitive auditory grouping principles	Oct 23, 2019	Music Source Separation	—Unverified
Cutting Music Source Separation Some Slakh: A Dataset to Study the Impact of Training Data Quality and Quantity	Sep 18, 2019	Data AugmentationMusic Source Separation	—Unverified
Sams-Net: A Sliced Attention-based Neural Network for Music Source Separation	Sep 12, 2019	Audio Source SeparationMusic Source Separation	CodeCode Available
Open-Unmix - A Reference Implementation for Music Source Separation	Sep 8, 2019	Music Source Separation	CodeCode Available
Demucs: Deep Extractor for Music Sources with extra unlabeled data remixed	Sep 3, 2019	Music Source Separation	CodeCode Available
Dilated Convolution with Dilated GRU for Music Source Separation	Jun 4, 2019	Music Source Separation	—Unverified
Examining the Mapping Functions of Denoising Autoencoders in Singing Voice Separation	Apr 12, 2019	DecoderDenoising	—Unverified
Spectrogram Feature Losses for Music Source Separation	Jan 15, 2019	Deep LearningMusic Source Separation	—Unverified
Semi-Supervised Monaural Singing Voice Separation With a Masking Network Trained on Synthetic Mixtures	Dec 14, 2018	Music Source SeparationSpeech Separation	CodeCode Available
Class-conditional embeddings for music source separation	Nov 7, 2018	ClusteringDeep Clustering	—Unverified

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	SCNet	SDR (avg)	9	—	Unverified
6	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified