Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 107 papers

Title	Date	Tasks	Status
HTMD-Net: A Hybrid Masking-Denoising Approach to Time-Domain Monaural Singing Voice Separation	Mar 7, 2021	Computational EfficiencyDenoising	—Unverified
Hybrid Spectrogram and Waveform Source Separation	Nov 5, 2021	Music Source Separation	—Unverified
Hybrid Y-Net Architecture for Singing Voice Separation	Mar 5, 2023	Music Source Separation	—Unverified
Improving Real-Time Music Accompaniment Separation with MMDenseNet	Jun 30, 2024	Music Source Separation	—Unverified
Is MixIT Really Unsuitable for Correlated Sources? Exploring MixIT for Unsupervised Pre-training in Music Source Separation	May 12, 2025	Music Source SeparationUnsupervised Pre-training	—Unverified
Jointist: Simultaneous Improvement of Multi-instrument Transcription and Music Source Separation via Joint Training	Feb 1, 2023	Chord RecognitionInstrument Recognition	—Unverified
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation	Jan 7, 2025	Information RetrievalMusic Information Retrieval	—Unverified
MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement	Oct 6, 2023	Music Source SeparationSpeech Enhancement	—Unverified
Multi-scale temporal-frequency attention for music source separation	Sep 2, 2022	Music Source Separation	—Unverified
Multitask learning for instrument activation aware music source separation	Aug 3, 2020	Information RetrievalMusic Information Retrieval	—Unverified
Music Foundation Model as Generic Booster for Music Downstream Tasks	Nov 2, 2024	Music Source SeparationMusic Tagging	—Unverified
Music Separation Enhancement with Generative Modeling	Aug 26, 2022	Music Source Separation	—Unverified
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
Pac-HuBERT: Self-Supervised Music Source Separation via Primitive Auditory Clustering and Hidden-Unit BERT	Apr 4, 2023	ClusteringDecoder	—Unverified
Pre-trained Spatial Priors on Multichannel NMF for Music Source Separation	Oct 9, 2023	Music Source Separation	—Unverified
Real-time Low-latency Music Source Separation using Hybrid Spectrogram-TasNet	Feb 27, 2024	Music Source Separation	—Unverified
Distortion Audio Effects: Learning How to Recover the Clean Signal	Feb 3, 2022	Music Source Separation	—Unverified
Resource-constrained stereo singing voice cancellation	Jan 22, 2024	Music Source SeparationSpeech Separation	—Unverified
Sanidha: A Studio Quality Multi-Modal Dataset for Carnatic Music	Jan 12, 2025	Music Source Separation	—Unverified
Self-refining of Pseudo Labels for Music Source Separation with Noisy Labeled Data	Jul 24, 2023	Instrument RecognitionMusic Source Separation	—Unverified
Separate This, and All of these Things Around It: Music Source Separation via Hyperellipsoidal Queries	Jan 27, 2025	AllMusic Source Separation	—Unverified
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline	Apr 30, 2025	Music Source SeparationVideo Restoration	—Unverified
Source Separation and Depthwise Separable Convolutions for Computer Audition	Dec 6, 2020	Music Source SeparationRepresentation Learning	—Unverified
SpaIn-Net: Spatially-Informed Stereophonic Music Source Separation	Feb 15, 2022	DisentanglementMusic Source Separation	—Unverified

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified