Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 982 papers

Title	Date	Tasks	Status	Hype	Score
Multi-dimensional Speech Quality Assessment in Crowdsourcing	Sep 14, 2023	Speech Enhancement	CodeCode Available	1	5
MultiSV: Dataset for Far-Field Multi-Channel Speaker Verification	Nov 11, 2021	DenoisingSpeaker Verification	CodeCode Available	1	5
Time-domain Speech Enhancement with Generative Adversarial Learning	Mar 30, 2021	Generative Adversarial NetworkSpeech Enhancement	CodeCode Available	0	5
The Second DIHARD Diarization Challenge: Dataset, task, and baselines	Jun 18, 2019	Action DetectionActivity Detection	CodeCode Available	0	5
Time-Graph Frequency Representation with Singular Value Decomposition for Neural Speech Enhancement	Dec 22, 2024	Speech Enhancement	CodeCode Available	0	5
Towards a Competitive End-to-End Speech Recognition for CHiME-6 Dinner Party Transcription	Apr 22, 2020	Data AugmentationSpeech Enhancement	CodeCode Available	0	5
Deep Multi-Frame MVDR Filtering for Single-Microphone Speech Enhancement	Nov 20, 2020	Speech Enhancement	CodeCode Available	0	5
Supervised and Unsupervised Speech Enhancement Using Nonnegative Matrix Factorization	Sep 15, 2017	DenoisingSpeech Denoising	CodeCode Available	0	5
Word-level Embeddings for Cross-Task Transfer Learning in Speech Processing	Oct 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0	5
Speech Enhancement for Virtual Meetings on Cellular Networks	Feb 2, 2023	Deep LearningSpeech Enhancement	CodeCode Available	0	5
Speech Enhancement with Overlapped-Frame Information Fusion and Causal Self-Attention	Jan 21, 2025	Speech Enhancement	CodeCode Available	0	5
Speech-enhanced and Noise-aware Networks for Robust Speech Recognition	Mar 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0	5
Speech Denoising Convolutional Neural Network trained with Deep Feature Losses.	Jun 27, 2018	Audio TaggingDenoising	CodeCode Available	0	5
Speech Enhancement based on Denoising Autoencoder with Multi-branched Encoders	Jan 6, 2020	DecoderDenoising	CodeCode Available	0	5
Single Channel Speech Enhancement Using U-Net Spiking Neural Networks	Jul 26, 2023	Speech Enhancement	CodeCode Available	0	5
Attention-based multi-task learning for speech-enhancement and speaker-identification in multi-speaker dialogue scenario	Jan 7, 2021	Multi-Task LearningSpeaker Identification	CodeCode Available	0	5
A Perceptual Weighting Filter Loss for DNN Training in Speech Enhancement	May 23, 2019	Speech Enhancement	CodeCode Available	0	5
Sparse Mixture of Local Experts for Efficient Speech Enhancement	May 16, 2020	Speech DenoisingSpeech Enhancement	CodeCode Available	0	5
Speech Enhancement with Zero-Shot Model Selection	Dec 17, 2020	Ensemble Learningmodel	CodeCode Available	0	5
Self-Supervised Learning for Speech Enhancement through Synthesis	Nov 4, 2022	DenoisingSelf-Supervised Learning	CodeCode Available	0	5
Room Impulse Response Estimation through Optimal Mass Transport Barycenters	Mar 18, 2025	Speech Enhancement	CodeCode Available	0	5
ROSE: A Recognition-Oriented Speech Enhancement Framework in Air Traffic Control Using Multi-Objective Learning	Dec 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0	5
RHR-Net: A Residual Hourglass Recurrent Neural Network for Speech Enhancement	Apr 15, 2019	Speech Enhancement	CodeCode Available	0	5
A Training and Inference Strategy Using Noisy and Enhanced Speech as Target for Speech Enhancement without Clean Speech	Oct 27, 2022	Speech Enhancement	CodeCode Available	0	5
rVAD: An Unsupervised Segment-Based Robust Voice Activity Detection Method	Jun 9, 2019	Action DetectionActivity Detection	CodeCode Available	0	5
Self-Supervised Learning from Contrastive Mixtures for Personalized Speech Enhancement	Nov 6, 2020	Contrastive LearningFew-Shot Learning	CodeCode Available	0	5
Receptive Field Analysis of Temporal Convolutional Networks for Monaural Speech Dereverberation	Apr 13, 2022	Speech DereverberationSpeech Enhancement	CodeCode Available	0	5
PL-EESR: Perceptual Loss Based END-TO-END Robust Speaker Representation Extraction	Oct 3, 2021	Speaker IdentificationSpeaker Verification	CodeCode Available	0	5
Phase-aware Single-stage Speech Denoising and Dereverberation with U-Net	Jun 1, 2020	DenoisingSpeech Denoising	CodeCode Available	0	5
Objective and subjective evaluation of speech enhancement methods in the UDASE task of the 7th CHiME challenge	Feb 2, 2024	Domain AdaptationSpeech Enhancement	CodeCode Available	0	5
Contaminated speech training methods for robust DNN-HMM distant speech recognition	Oct 10, 2017	Distant Speech RecognitionSpeech Enhancement	CodeCode Available	0	5
Complex Recurrent Variational Autoencoder with Application to Speech Enhancement	Apr 5, 2022	Speech Enhancement	CodeCode Available	0	5
DEEP COMPLEX-VALUED NEURAL BEAMFORMERS	May 1, 2019	Speech Enhancement	CodeCode Available	0	5
MMTM: Multimodal Transfer Module for CNN Fusion	Nov 20, 2019	Action RecognitionAction Recognition In Videos	CodeCode Available	0	5
Magnitude-Phase Dual-Path Speech Enhancement Network based on Self-Supervised Embedding and Perceptual Contrast Stretch Boosting	Mar 27, 2025	Self-Supervised LearningSpeech Enhancement	CodeCode Available	0	5
Learning with Learned Loss Function: Speech Enhancement with Quality-Net to Improve Perceptual Evaluation of Speech Quality	May 6, 2019	Speech Enhancement	CodeCode Available	0	5
Language and Noise Transfer in Speech Enhancement Generative Adversarial Network	Dec 18, 2017	Generative Adversarial NetworkSpeech Enhancement	CodeCode Available	0	5
Speech Enhancement Based on Reducing the Detail Portion of Speech Spectrograms in Modulation Domain via Discrete Wavelet Transform	Nov 8, 2018	Speech Enhancement	CodeCode Available	0	5
Lessons Learned from the URGENT 2024 Speech Enhancement Challenge	Jun 2, 2025	Speech Enhancement	CodeCode Available	0	5
Investigating the effect of residual and highway connections in speech enhancement models	Oct 22, 2018	DenoisingSpeech Denoising	CodeCode Available	0	5
Investigating Generative Adversarial Networks based Speech Dereverberation for Robust Speech Recognition	Mar 27, 2018	Robust Speech RecognitionSpeech Dereverberation	CodeCode Available	0	5
Let SSMs be ConvNets: State-space Modeling with Optimal Tensor Contractions	Jan 22, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0	5
Improved Speech Enhancement with the Wave-U-Net	Nov 27, 2018	Audio Source SeparationSpeech Enhancement	CodeCode Available	0	5
BSS-CFFMA: Cross-Domain Feature Fusion and Multi-Attention Speech Enhancement Network based on Self-Supervised Embedding	Aug 13, 2024	DenoisingSelf-Supervised Learning	CodeCode Available	0	5
How to train your ears: Auditory-model emulation for large-dynamic-range inputs and mild-to-severe hearing losses	Mar 15, 2024	Speech Enhancement	CodeCode Available	0	5
High-Resolution Speech Restoration with Latent Diffusion Model	Sep 17, 2024	modelSpeech Enhancement	CodeCode Available	0	5
Adversarial Privacy Protection on Speech Enhancement	Jun 16, 2022	Speech Enhancement	CodeCode Available	0	5
The Effect of Spoken Language on Speech Enhancement using Self-Supervised Speech Representation Loss Functions	Jul 27, 2023	Speech Enhancement	CodeCode Available	0	5
Masks Fusion with Multi-Target Learning For Speech Enhancement	Sep 23, 2021	Speech Enhancement	CodeCode Available	0	5
Boosting Domain Incremental Learning: Selecting the Optimal Parameters is All You Need	May 29, 2025	Allimage-classification	CodeCode Available	0	5

Show:10 25 50

← PrevPage 5 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified