Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 107 papers

Title	Date	Tasks	Status
MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement	Oct 6, 2023	Music Source SeparationSpeech Enhancement	—Unverified
Multi-scale temporal-frequency attention for music source separation	Sep 2, 2022	Music Source Separation	—Unverified
Multitask learning for instrument activation aware music source separation	Aug 3, 2020	Information RetrievalMusic Information Retrieval	—Unverified
Music Foundation Model as Generic Booster for Music Downstream Tasks	Nov 2, 2024	Music Source SeparationMusic Tagging	—Unverified
Music Separation Enhancement with Generative Modeling	Aug 26, 2022	Music Source Separation	—Unverified
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified
On loss functions and evaluation metrics for music source separation	Feb 16, 2022	Audio Source SeparationBenchmarking	—Unverified
Pac-HuBERT: Self-Supervised Music Source Separation via Primitive Auditory Clustering and Hidden-Unit BERT	Apr 4, 2023	ClusteringDecoder	—Unverified
Pre-trained Spatial Priors on Multichannel NMF for Music Source Separation	Oct 9, 2023	Music Source Separation	—Unverified
Real-time Low-latency Music Source Separation using Hybrid Spectrogram-TasNet	Feb 27, 2024	Music Source Separation	—Unverified
Distortion Audio Effects: Learning How to Recover the Clean Signal	Feb 3, 2022	Music Source Separation	—Unverified
Resource-constrained stereo singing voice cancellation	Jan 22, 2024	Music Source SeparationSpeech Separation	—Unverified
Subnetwork-to-go: Elastic Neural Network with Dynamic Training and Customizable Inference	Dec 6, 2023	Dynamic neural networksMusic Source Separation	—Unverified
Task-Aware Unified Source Separation	Oct 31, 2024	Audio Source SeparationMusic Source Separation	—Unverified
Transcription Is All You Need: Learning to Separate Musical Mixtures with Score as Supervision	Oct 22, 2020	AllMusic Source Separation	—Unverified
Upsampling layers for music source separation	Nov 23, 2021	Music Source Separation	—Unverified
Voice and accompaniment separation in music using self-attention convolutional neural network	Mar 19, 2020	Music Source Separation	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
Primal-Dual Algorithms for Non-negative Matrix Factorization with the Kullback-Leibler Divergence	Dec 4, 2014	Face RecognitionMusic Source Separation	CodeCode Available
Open-Unmix - A Reference Implementation for Music Source Separation	Sep 8, 2019	Music Source Separation	CodeCode Available
Music source separation conditioned on 3D point clouds	Feb 3, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available
Multi-scale Multi-band DenseNets for Audio Source Separation	Jun 29, 2017	Audio Source Separationimage-classification	CodeCode Available
D3Net: Densely connected multidilated DenseNet for music source separation	Oct 5, 2020	Music Source Separation	CodeCode Available
Machine Perceptual Quality: Evaluating the Impact of Severe Lossy Compression on Audio and Image Models	Jan 15, 2024	Data Compressionimage-classification	CodeCode Available
Low Latency Time Domain Multichannel Speech and Music Source Separation	Apr 12, 2022	Music Source Separation	CodeCode Available

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified