Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 107 papers

Title	Date	Tasks	Status	Hype
Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)	Sep 15, 2023	Music Source Separation	CodeCode Available	2
Contrastive Learning based Deep Latent Masking for Music Source Separation	Aug 20, 2023	Contrastive LearningMusic Source Separation	—Unverified	0
The Sound Demixing Challenge 2023 x2013 Music Demixing Track	Aug 14, 2023	Music Source Separation	CodeCode Available	2
Self-refining of Pseudo Labels for Music Source Separation with Noisy Labeled Data	Jul 24, 2023	Instrument RecognitionMusic Source Separation	—Unverified	0
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3	Jun 15, 2023	Music Source Separation	CodeCode Available	1
Quantifying Spatial Audio Quality Impairment	Jun 13, 2023	Audio CompressionMusic Source Separation	CodeCode Available	1
The Whole Is Greater than the Sum of Its Parts: Improving Music Source Separation by Bridging Network	May 13, 2023	Music Source Separation	CodeCode Available	4
Pac-HuBERT: Self-Supervised Music Source Separation via Primitive Auditory Clustering and Hidden-Unit BERT	Apr 4, 2023	ClusteringDecoder	—Unverified	0
Hybrid Y-Net Architecture for Singing Voice Separation	Mar 5, 2023	Music Source Separation	—Unverified	0
Jointist: Simultaneous Improvement of Multi-instrument Transcription and Music Source Separation via Joint Training	Feb 1, 2023	Chord RecognitionInstrument Recognition	—Unverified	0
Hybrid Transformers for Music Source Separation	Nov 15, 2022	Music Source SeparationSpeech Enhancement	CodeCode Available	5
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1
MedleyVox: An Evaluation Dataset for Multiple Singing Voices Separation	Nov 14, 2022	Music Source SeparationSuper-Resolution	CodeCode Available	1
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1
Music Source Separation with Band-split RNN	Sep 30, 2022	Music Source Separation	CodeCode Available	1
Multi-scale temporal-frequency attention for music source separation	Sep 2, 2022	Music Source Separation	—Unverified	0
Music Separation Enhancement with Generative Modeling	Aug 26, 2022	Music Source Separation	—Unverified	0
Hierarchic Temporal Convolutional Network With Cross-Domain Encoder for Music Source Separation	Jun 30, 2022	Audio Source SeparationMusic Source Separation	—Unverified	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
Music Source Separation with Generative Flow	Apr 19, 2022	Music Source Separation	CodeCode Available	1
Low Latency Time Domain Multichannel Speech and Music Source Separation	Apr 12, 2022	Music Source Separation	CodeCode Available	0
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices	Apr 5, 2022	Audio-Visual SynchronizationMusic Source Separation	CodeCode Available	1
Feature-informed Latent Space Regularization for Music Source Separation	Mar 17, 2022	Multi-Task LearningMusic Source Separation	—Unverified	0
On loss functions and evaluation metrics for music source separation	Feb 16, 2022	Audio Source SeparationBenchmarking	—Unverified	0
SpaIn-Net: Spatially-Informed Stereophonic Music Source Separation	Feb 15, 2022	DisentanglementMusic Source Separation	—Unverified	0

Show:10 25 50

← PrevPage 2 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified