Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 107 papers

Title	Date	Tasks	Status	Hype
Hybrid Transformers for Music Source Separation	Nov 15, 2022	Music Source SeparationSpeech Enhancement	CodeCode Available	5
The Whole Is Greater than the Sum of Its Parts: Improving Music Source Separation by Bridging Network	May 13, 2023	Music Source Separation	CodeCode Available	4
Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation	Sep 20, 2018	Multi-task Audio Source SeperationMusic Source Separation	CodeCode Available	3
Training-Free Multi-Step Audio Source Separation	May 26, 2025	Audio Source SeparationDenoising	CodeCode Available	2
A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems	Jun 26, 2024	Audio Source SeparationDecoder	CodeCode Available	2
SCNet: Sparse Compression Network for Music Source Separation	Jan 24, 2024	CPUMusic Source Separation	CodeCode Available	2
Pre-training Music Classification Models via Music Source Separation	Oct 24, 2023	ClassificationGenre classification	CodeCode Available	2
Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)	Sep 15, 2023	Music Source Separation	CodeCode Available	2
The Sound Demixing Challenge 2023 x2013 Music Demixing Track	Aug 14, 2023	Music Source Separation	CodeCode Available	2
All for One and One for All: Improving Music Separation by Bridging Networks	Oct 8, 2020	AllMusic Source Separation	CodeCode Available	2
Music Source Restoration	May 27, 2025	Music Source Separation	CodeCode Available	1
SynthSOD: Developing an Heterogeneous Dataset for Orchestra Music Source Separation	Sep 17, 2024	Music Source Separation	CodeCode Available	1
A fully differentiable model for unsupervised singing voice separation	Jan 30, 2024	Music Source Separation	CodeCode Available	1
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3	Jun 15, 2023	Music Source Separation	CodeCode Available	1
Quantifying Spatial Audio Quality Impairment	Jun 13, 2023	Audio CompressionMusic Source Separation	CodeCode Available	1
MedleyVox: An Evaluation Dataset for Multiple Singing Voices Separation	Nov 14, 2022	Music Source SeparationSuper-Resolution	CodeCode Available	1
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1
Music Source Separation with Band-split RNN	Sep 30, 2022	Music Source Separation	CodeCode Available	1
Music Source Separation with Generative Flow	Apr 19, 2022	Music Source Separation	CodeCode Available	1
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices	Apr 5, 2022	Audio-Visual SynchronizationMusic Source Separation	CodeCode Available	1
Unsupervised Music Source Separation Using Differentiable Parametric Source Models	Jan 24, 2022	Audio Source SeparationDeep Learning	CodeCode Available	1
CWS-PResUNet: Music Source Separation with Channel-wise Subband Phase-aware ResUNet	Dec 9, 2021	Music Source Separation	CodeCode Available	1
Danna-Sep: Unite to separate them all	Dec 7, 2021	AllMusic Source Separation	CodeCode Available	1
Transfer Learning with Jukebox for Music Source Separation	Nov 28, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	1
KUIELab-MDX-Net: A Two-Stream Neural Network for Music Demixing	Nov 24, 2021	Music Source SeparationVocal Bursts Valence Prediction	CodeCode Available	1
Unsupervised Source Separation via Bayesian Inference in the Latent Domain	Oct 11, 2021	Audio Source SeparationBayesian Inference	CodeCode Available	1
Music Demixing Challenge 2021	Aug 31, 2021	Music Source Separation	CodeCode Available	1
A Unified Model for Zero-shot Music Source Separation, Transcription and Synthesis	Aug 7, 2021	DecoderDisentanglement	CodeCode Available	1
Multi-Task Audio Source Separation	Jul 14, 2021	Audio Source SeparationMulti-task Audio Source Seperation	CodeCode Available	1
A cappella: Audio-visual Singing Voice Separation	Apr 20, 2021	Music Source SeparationSpeech Separation	CodeCode Available	1
LaSAFT: Latent Source Attentive Frequency Transformation for Conditioned Source Separation	Oct 22, 2020	Music Source Separation	CodeCode Available	1
Mixing-Specific Data Augmentation Techniques for Improved Blind Violin/Piano Source Separation	Aug 6, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1
Multi-channel U-Net for Music Source Separation	Mar 23, 2020	Music Source Separation	CodeCode Available	1
Unsupervised Interpretable Representation Learning for Singing Voice Separation	Mar 3, 2020	DenoisingMusic Source Separation	CodeCode Available	1
Meta-learning Extractors for Music Source Separation	Feb 17, 2020	Meta-LearningMusic Source Separation	CodeCode Available	1
Time-Domain Audio Source Separation Based on Wave-U-Net Combined with Discrete Wavelet Transform	Jan 28, 2020	Audio Source SeparationMusic Source Separation	CodeCode Available	1
Spleeter: A Fast And State-of-the Art Music Source Separation Tool With Pre-trained Models	Nov 4, 2019	GPUMusic Source Separation	CodeCode Available	1
End-to-end music source separation: is it possible in the waveform domain?	Oct 29, 2018	Deep LearningMusic Source Separation	CodeCode Available	1
Wave-U-Net: A Multi-Scale Neural Network for End-to-End Audio Source Separation	Jun 8, 2018	Audio Source SeparationMusic Source Separation	CodeCode Available	1
Is MixIT Really Unsuitable for Correlated Sources? Exploring MixIT for Unsupervised Pre-training in Music Source Separation	May 12, 2025	Music Source SeparationUnsupervised Pre-training	—Unverified	0
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline	Apr 30, 2025	Music Source SeparationVideo Restoration	—Unverified	0
Score-informed Music Source Separation: Improving Synthetic-to-real Generalization in Classical Music	Mar 10, 2025	Music Source Separation	CodeCode Available	0
Separate This, and All of these Things Around It: Music Source Separation via Hyperellipsoidal Queries	Jan 27, 2025	AllMusic Source Separation	—Unverified	0
Sanidha: A Studio Quality Multi-Modal Dataset for Carnatic Music	Jan 12, 2025	Music Source Separation	—Unverified	0
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation	Jan 7, 2025	Information RetrievalMusic Information Retrieval	—Unverified	0
Learned Compression for Compressed Learning	Dec 12, 2024	Colorizationdocument understanding	CodeCode Available	0
Music Foundation Model as Generic Booster for Music Downstream Tasks	Nov 2, 2024	Music Source SeparationMusic Tagging	—Unverified	0
Task-Aware Unified Source Separation	Oct 31, 2024	Audio Source SeparationMusic Source Separation	—Unverified	0
An Ensemble Approach to Music Source Separation: A Comparative Analysis of Conventional and Hierarchical Stem Separation	Oct 28, 2024	Music Source Separation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified