Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 107 papers

Title	Date	Tasks	Status	Hype	Score
End-to-end music source separation: is it possible in the waveform domain?	Oct 29, 2018	Deep LearningMusic Source Separation	CodeCode Available	1	5
Danna-Sep: Unite to separate them all	Dec 7, 2021	AllMusic Source Separation	CodeCode Available	1	5
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices	Apr 5, 2022	Audio-Visual SynchronizationMusic Source Separation	CodeCode Available	1	5
Unsupervised Music Source Separation Using Differentiable Parametric Source Models	Jan 24, 2022	Audio Source SeparationDeep Learning	CodeCode Available	1	5
Music Source Restoration	May 27, 2025	Music Source Separation	CodeCode Available	1	5
Unsupervised Interpretable Representation Learning for Singing Voice Separation	Mar 3, 2020	DenoisingMusic Source Separation	CodeCode Available	1	5
Multi-Task Audio Source Separation	Jul 14, 2021	Audio Source SeparationMulti-task Audio Source Seperation	CodeCode Available	1	5
A cappella: Audio-visual Singing Voice Separation	Apr 20, 2021	Music Source SeparationSpeech Separation	CodeCode Available	1	5
Multi-channel U-Net for Music Source Separation	Mar 23, 2020	Music Source Separation	CodeCode Available	1	5
Mixing-Specific Data Augmentation Techniques for Improved Blind Violin/Piano Source Separation	Aug 6, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1	5
CWS-PResUNet: Music Source Separation with Channel-wise Subband Phase-aware ResUNet	Dec 9, 2021	Music Source Separation	CodeCode Available	1	5
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1	5
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1	5
Music Demixing Challenge 2021	Aug 31, 2021	Music Source Separation	CodeCode Available	1	5
Unsupervised Source Separation via Bayesian Inference in the Latent Domain	Oct 11, 2021	Audio Source SeparationBayesian Inference	CodeCode Available	1	5
Adversarial Semi-Supervised Audio Source Separation applied to Singing Voice Extraction	Oct 31, 2017	Audio Source SeparationData Augmentation	CodeCode Available	0	5
Sams-Net: A Sliced Attention-based Neural Network for Music Source Separation	Sep 12, 2019	Audio Source SeparationMusic Source Separation	CodeCode Available	0	5
Semi-Supervised Monaural Singing Voice Separation With a Masking Network Trained on Synthetic Mixtures	Dec 14, 2018	Music Source SeparationSpeech Separation	CodeCode Available	0	5
Machine Perceptual Quality: Evaluating the Impact of Severe Lossy Compression on Audio and Image Models	Jan 15, 2024	Data Compressionimage-classification	CodeCode Available	0	5
Primal-Dual Algorithms for Non-negative Matrix Factorization with the Kullback-Leibler Divergence	Dec 4, 2014	Face RecognitionMusic Source Separation	CodeCode Available	0	5
Low Latency Time Domain Multichannel Speech and Music Source Separation	Apr 12, 2022	Music Source Separation	CodeCode Available	0	5
Learned Compression for Compressed Learning	Dec 12, 2024	Colorizationdocument understanding	CodeCode Available	0	5
Sampling-Frequency-Independent Audio Source Separation Using Convolution Layer Based on Impulse Invariant Method	May 10, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	0	5
Music source separation conditioned on 3D point clouds	Feb 3, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	0	5
Open-Unmix - A Reference Implementation for Music Source Separation	Sep 8, 2019	Music Source Separation	CodeCode Available	0	5

Show:10 25 50

← PrevPage 2 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified