Audio Source Separation

Audio Source Separation is the process of separating a mixture (e.g. a pop band recording) into isolated sounds from individual sources (e.g. just the lead vocals).

Source: Model selection for deep audio source separation via clustering analysis

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 112 papers

Title	Date	Tasks	Status	Hype	Score
Separate Anything You Describe	Aug 9, 2023	Audio Source SeparationNatural Language Queries	CodeCode Available	3	5
Training-Free Multi-Step Audio Source Separation	May 26, 2025	Audio Source SeparationDenoising	CodeCode Available	2	5
A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems	Jun 26, 2024	Audio Source SeparationDecoder	CodeCode Available	2	5
Remastering Divide and Remaster: A Cinematic Audio Source Separation Dataset with Multilingual Support	Jul 9, 2024	Audio Source SeparationDiversity	CodeCode Available	1	5
Unified Gradient Reweighting for Model Biasing with Applications to Source Separation	Oct 25, 2020	Audio Source Separation	CodeCode Available	1	5
Unsupervised Source Separation By Steering Pretrained Music Models	Oct 25, 2021	Audio GenerationAudio Source Separation	CodeCode Available	1	5
Time-Domain Audio Source Separation Based on Wave-U-Net Combined with Discrete Wavelet Transform	Jan 28, 2020	Audio Source SeparationMusic Source Separation	CodeCode Available	1	5
The Cocktail Fork Problem: Three-Stem Audio Separation for Real-World Soundtracks	Oct 19, 2021	Audio Source Separation	CodeCode Available	1	5
Sudo rm -rf: Efficient Networks for Universal Audio Source Separation	Jul 14, 2020	Audio Source SeparationEfficient Neural Network	CodeCode Available	1	5
Hybrid Neural Networks for On-device Directional Hearing	Dec 11, 2021	Audio Source SeparationCausal Inference	CodeCode Available	1	5
Unsupervised Source Separation via Bayesian Inference in the Latent Domain	Oct 11, 2021	Audio Source SeparationBayesian Inference	CodeCode Available	1	5
AutoClip: Adaptive Gradient Clipping for Source Separation Networks	Jul 25, 2020	Audio Source Separation	CodeCode Available	1	5
Unsupervised Audio Source Separation using Generative Priors	May 28, 2020	Audio Source Separation	CodeCode Available	1	5
Unsupervised Composable Representations for Audio	Aug 19, 2024	Audio Source Separationblind source separation	CodeCode Available	1	5
Wave-U-Net: A Multi-Scale Neural Network for End-to-End Audio Source Separation	Jun 8, 2018	Audio Source SeparationMusic Source Separation	CodeCode Available	1	5
OtoWorld: Towards Learning to Separate by Learning to Move	Jul 12, 2020	Audio Source SeparationNavigate	CodeCode Available	1	5
Leveraging LLM and Text-Queried Separation for Noise-Robust Sound Event Detection	Nov 2, 2024	Audio Source SeparationEvent Detection	CodeCode Available	1	5
Transfer Learning with Jukebox for Music Source Separation	Nov 28, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	1	5
Zero-shot Audio Source Separation through Query-based Learning from Weakly-labeled Data	Dec 15, 2021	Audio Source SeparationAudio Tagging	CodeCode Available	1	5
Separate What You Describe: Language-Queried Audio Source Separation	Mar 28, 2022	AudioCapsAudio Source Separation	CodeCode Available	1	5
Spectral Mapping of Singing Voices: U-Net-Assisted Vocal Segmentation	May 30, 2024	Audio Signal ProcessingAudio Source Separation	CodeCode Available	1	5
Deep Audio Waveform Prior	Jul 21, 2022	Audio inpaintingAudio Source Separation	CodeCode Available	1	5
The Cone of Silence: Speech Separation by Localization	Oct 12, 2020	Audio Source SeparationSpeech Separation	CodeCode Available	1	5
Parallel and Flexible Sampling from Autoregressive Models via Langevin Dynamics	May 17, 2021	Audio Source SeparationSuper-Resolution	CodeCode Available	1	5
Differentiable Model Compression via Pseudo Quantization Noise	Apr 20, 2021	Audio Source Separationimage-classification	CodeCode Available	1	5
Directional Sparse Filtering using Weighted Lehmer Mean for Blind Separation of Unbalanced Speech Mixtures	Jan 30, 2021	Audio Source Separationblind source separation	CodeCode Available	1	5
Exploring Text-Queried Sound Event Detection with Audio Source Separation	Sep 20, 2024	Audio Source SeparationEvent Detection	CodeCode Available	1	5
Facing the Music: Tackling Singing Voice Separation in Cinematic Audio Source Separation	Aug 7, 2024	Audio Source SeparationDecoder	CodeCode Available	1	5
Compute and memory efficient universal sound source separation	Mar 3, 2021	Audio Source SeparationEfficient Neural Network	CodeCode Available	1	5
Unsupervised Music Source Separation Using Differentiable Parametric Source Models	Jan 24, 2022	Audio Source SeparationDeep Learning	CodeCode Available	1	5
A Generalized Bandsplit Neural Network for Cinematic Audio Source Separation	Sep 5, 2023	Audio Source Separation	CodeCode Available	1	5
Multi-Task Audio Source Separation	Jul 14, 2021	Audio Source SeparationMulti-task Audio Source Seperation	CodeCode Available	1	5
Training Generative Adversarial Networks from Incomplete Observations using Factorised Discriminators	May 29, 2019	Audio Source SeparationImage Generation	CodeCode Available	0	5
Learning to Separate Object Sounds by Watching Unlabeled Video	Apr 5, 2018	Audio DenoisingAudio Source Separation	CodeCode Available	0	5
Learning Audio-Visual Dynamics Using Scene Graphs for Audio Source Separation	Oct 29, 2022	Audio Source SeparationVisually Guided Sound Source Separation	CodeCode Available	0	5
J-Net: Randomly weighted U-Net for audio source separation	Nov 29, 2019	Audio Source SeparationDecoder	CodeCode Available	0	5
Audio-Visual Scene Analysis with Self-Supervised Multisensory Features	Apr 10, 2018	Action RecognitionAudio Source Separation	CodeCode Available	0	5
Sams-Net: A Sliced Attention-based Neural Network for Music Source Separation	Sep 12, 2019	Audio Source SeparationMusic Source Separation	CodeCode Available	0	5
Densely Connected Multi-Dilated Convolutional Networks for Dense Prediction Tasks	Jun 19, 2021	Audio Source SeparationSemantic Segmentation	CodeCode Available	0	5
Sparse Gaussian Process Audio Source Separation Using Spectrum Priors in the Time-Domain	Oct 30, 2018	Audio Source Separation	CodeCode Available	0	5
Improved Speech Enhancement with the Wave-U-Net	Nov 27, 2018	Audio Source SeparationSpeech Enhancement	CodeCode Available	0	5
A Provably Correct and Robust Algorithm for Convolutive Nonnegative Matrix Factorization	Jun 17, 2019	Audio Source Separation	CodeCode Available	0	5
Towards Reliable Objective Evaluation Metrics for Generative Singing Voice Separation Models	Jul 15, 2025	Audio Source Separationblind source separation	CodeCode Available	0	5
Co-Separating Sounds of Visual Objects	Apr 16, 2019	Audio DenoisingAudio Source Separation	CodeCode Available	0	5
Retrieving Signals in the Frequency Domain with Deep Complex Extractors	Sep 25, 2019	Audio Source Separation	CodeCode Available	0	5
Adversarial Semi-Supervised Audio Source Separation applied to Singing Voice Extraction	Oct 31, 2017	Audio Source SeparationData Augmentation	CodeCode Available	0	5
Sampling-Frequency-Independent Audio Source Separation Using Convolution Layer Based on Impulse Invariant Method	May 10, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	0	5
Conditioned-U-Net: Introducing a Control Mechanism in the U-Net for Multiple Source Separations	Jul 2, 2019	Audio Source Separation	CodeCode Available	0	5
Generalization Challenges for Neural Architectures in Audio Source Separation	Mar 23, 2018	Audio Source Separation	CodeCode Available	0	5
Music source separation conditioned on 3D point clouds	Feb 3, 2021	Audio Source SeparationMusic Source Separation	CodeCode Available	0	5

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets AudioSet MUSIC (multi-source)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-SED-SEP	SDR	10.55	—	Unverified
2	Co-Separation	SDR	4.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Co-Separation	SAR	11.3	—	Unverified