Music Source Separation

Music source separation is the task of decomposing music into its constitutive components, e. g., yielding separated stems for the vocals, bass, and drums.

( Image credit: SigSep )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 107 papers

Title	Date	Tasks	Status	Hype
Music Source Restoration	May 27, 2025	Music Source Separation	CodeCode Available	1
Training-Free Multi-Step Audio Source Separation	May 26, 2025	Audio Source SeparationDenoising	CodeCode Available	2
Is MixIT Really Unsuitable for Correlated Sources? Exploring MixIT for Unsupervised Pre-training in Music Source Separation	May 12, 2025	Music Source SeparationUnsupervised Pre-training	—Unverified	0
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline	Apr 30, 2025	Music Source SeparationVideo Restoration	—Unverified	0
Score-informed Music Source Separation: Improving Synthetic-to-real Generalization in Classical Music	Mar 10, 2025	Music Source Separation	CodeCode Available	0
Separate This, and All of these Things Around It: Music Source Separation via Hyperellipsoidal Queries	Jan 27, 2025	AllMusic Source Separation	—Unverified	0
Sanidha: A Studio Quality Multi-Modal Dataset for Carnatic Music	Jan 12, 2025	Music Source Separation	—Unverified	0
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation	Jan 7, 2025	Information RetrievalMusic Information Retrieval	—Unverified	0
Learned Compression for Compressed Learning	Dec 12, 2024	Colorizationdocument understanding	CodeCode Available	0
Music Foundation Model as Generic Booster for Music Downstream Tasks	Nov 2, 2024	Music Source SeparationMusic Tagging	—Unverified	0
Task-Aware Unified Source Separation	Oct 31, 2024	Audio Source SeparationMusic Source Separation	—Unverified	0
An Ensemble Approach to Music Source Separation: A Comparative Analysis of Conventional and Hierarchical Stem Separation	Oct 28, 2024	Music Source Separation	—Unverified	0
SynthSOD: Developing an Heterogeneous Dataset for Orchestra Music Source Separation	Sep 17, 2024	Music Source Separation	CodeCode Available	1
Improving Real-Time Music Accompaniment Separation with MMDenseNet	Jun 30, 2024	Music Source Separation	—Unverified	0
A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems	Jun 26, 2024	Audio Source SeparationDecoder	CodeCode Available	2
Why does music source separation benefit from cacophony?	Feb 28, 2024	Data AugmentationMusic Source Separation	—Unverified	0
Real-time Low-latency Music Source Separation using Hybrid Spectrogram-TasNet	Feb 27, 2024	Music Source Separation	—Unverified	0
A fully differentiable model for unsupervised singing voice separation	Jan 30, 2024	Music Source Separation	CodeCode Available	1
SCNet: Sparse Compression Network for Music Source Separation	Jan 24, 2024	CPUMusic Source Separation	CodeCode Available	2
Resource-constrained stereo singing voice cancellation	Jan 22, 2024	Music Source SeparationSpeech Separation	—Unverified	0
Machine Perceptual Quality: Evaluating the Impact of Severe Lossy Compression on Audio and Image Models	Jan 15, 2024	Data Compressionimage-classification	CodeCode Available	0
Subnetwork-to-go: Elastic Neural Network with Dynamic Training and Customizable Inference	Dec 6, 2023	Dynamic neural networksMusic Source Separation	—Unverified	0
Pre-training Music Classification Models via Music Source Separation	Oct 24, 2023	ClassificationGenre classification	CodeCode Available	2
Pre-trained Spatial Priors on Multichannel NMF for Music Source Separation	Oct 9, 2023	Music Source Separation	—Unverified	0
MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement	Oct 6, 2023	Music Source SeparationSpeech Enhancement	—Unverified	0
Music Source Separation Based on a Lightweight Deep Learning Framework (DTTNET: DUAL-PATH TFC-TDF UNET)	Sep 15, 2023	Music Source Separation	CodeCode Available	2
Contrastive Learning based Deep Latent Masking for Music Source Separation	Aug 20, 2023	Contrastive LearningMusic Source Separation	—Unverified	0
The Sound Demixing Challenge 2023 x2013 Music Demixing Track	Aug 14, 2023	Music Source Separation	CodeCode Available	2
Self-refining of Pseudo Labels for Music Source Separation with Noisy Labeled Data	Jul 24, 2023	Instrument RecognitionMusic Source Separation	—Unverified	0
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3	Jun 15, 2023	Music Source Separation	CodeCode Available	1
Quantifying Spatial Audio Quality Impairment	Jun 13, 2023	Audio CompressionMusic Source Separation	CodeCode Available	1
The Whole Is Greater than the Sum of Its Parts: Improving Music Source Separation by Bridging Network	May 13, 2023	Music Source Separation	CodeCode Available	4
Pac-HuBERT: Self-Supervised Music Source Separation via Primitive Auditory Clustering and Hidden-Unit BERT	Apr 4, 2023	ClusteringDecoder	—Unverified	0
Hybrid Y-Net Architecture for Singing Voice Separation	Mar 5, 2023	Music Source Separation	—Unverified	0
Jointist: Simultaneous Improvement of Multi-instrument Transcription and Music Source Separation via Joint Training	Feb 1, 2023	Chord RecognitionInstrument Recognition	—Unverified	0
Hybrid Transformers for Music Source Separation	Nov 15, 2022	Music Source SeparationSpeech Enhancement	CodeCode Available	5
An Efficient Short-Time Discrete Cosine Transform and Attentive MultiResUNet Framework for Music Source Separation	Nov 14, 2022	Music Source Separation	CodeCode Available	1
MedleyVox: An Evaluation Dataset for Multiple Singing Voices Separation	Nov 14, 2022	Music Source SeparationSuper-Resolution	CodeCode Available	1
Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects	Nov 4, 2022	Contrastive LearningDisentanglement	CodeCode Available	1
Music Source Separation with Band-split RNN	Sep 30, 2022	Music Source Separation	CodeCode Available	1
Multi-scale temporal-frequency attention for music source separation	Sep 2, 2022	Music Source Separation	—Unverified	0
Music Separation Enhancement with Generative Modeling	Aug 26, 2022	Music Source Separation	—Unverified	0
Hierarchic Temporal Convolutional Network With Cross-Domain Encoder for Music Source Separation	Jun 30, 2022	Audio Source SeparationMusic Source Separation	—Unverified	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
Music Source Separation with Generative Flow	Apr 19, 2022	Music Source Separation	CodeCode Available	1
Low Latency Time Domain Multichannel Speech and Music Source Separation	Apr 12, 2022	Music Source Separation	CodeCode Available	0
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices	Apr 5, 2022	Audio-Visual SynchronizationMusic Source Separation	CodeCode Available	1
Feature-informed Latent Space Regularization for Music Source Separation	Mar 17, 2022	Multi-Task LearningMusic Source Separation	—Unverified	0
On loss functions and evaluation metrics for music source separation	Feb 16, 2022	Audio Source SeparationBenchmarking	—Unverified	0
SpaIn-Net: Spatially-Informed Stereophonic Music Source Separation	Feb 15, 2022	DisentanglementMusic Source Separation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets MUSDB18 MUSDB18-HQ Slakh2100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
2	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
3	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
4	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
5	Band-Split RNN	SDR (avg)	8.23	—	Unverified
6	Hybrid Demucs	SDR (avg)	7.72	—	Unverified
7	KUIELab-MDX-Net	SDR (avg)	7.54	—	Unverified
8	CDE-HTCN	SDR (avg)	6.89	—	Unverified
9	Attentive-MultiResUNet	SDR (avg)	6.81	—	Unverified
10	DEMUCS (extra)	SDR (avg)	6.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BS-RoFormer (L=12, OA)	SDR (avg)	11.99	—	Unverified
2	BS-RoFormer (L=6, OA)	SDR (avg)	9.8	—	Unverified
3	SCNet-large	SDR (avg)	9.69	—	Unverified
4	Sparse HT Demucs (fine tuned)	SDR (avg)	9.2	—	Unverified
5	Hybrid Transformer Demucs (f.t.)	SDR (avg)	9	—	Unverified
6	SCNet	SDR (avg)	9	—	Unverified
7	Band-Split RNN (semi-sup.)	SDR (avg)	8.97	—	Unverified
8	TFC-TDF-UNet (v3)	SDR (avg)	8.34	—	Unverified
9	Band-Split RNN	SDR (avg)	8.24	—	Unverified
10	Dual-Path TFC-TDF UNet (DTTNet)	SDR (avg)	8.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiCoSe (Deterministic)	SI-SDRi (Bass)	20.04	—	Unverified
2	LQ-VAE + Scalable Transformer	SDR (bass)	7.42	—	Unverified