Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 982 papers

Title	Date	Tasks	Status
Single channel speech enhancement by colored spectrograms	Oct 26, 2023	DenoisingGenerative Adversarial Network	—Unverified
Single Channel Speech Enhancement Using Outlier Detection	May 4, 2016	Noise EstimationOutlier Detection	—Unverified
Single Channel Speech Enhancement Using Temporal Convolutional Recurrent Neural Networks	Feb 2, 2020	Speech Enhancement	—Unverified
Single-channel speech enhancement using learnable loss mixup	Dec 20, 2023	Speech Enhancement	—Unverified
Single-Channel Speech Enhancement with Deep Complex U-Networks and Probabilistic Latent Space Models	Sep 4, 2023	Speech Enhancement	—Unverified
SLMGAN: Exploiting Speech Language Model Representations for Unsupervised Zero-Shot Voice Conversion in GANs	Jul 18, 2023	Generative Adversarial NetworkLanguage Modeling	—Unverified
SNR-Based Features and Diverse Training Data for Robust DNN-Based Speech Enhancement	Apr 7, 2020	DiversitySpeech Enhancement	—Unverified
SNR-Based Teachers-Student Technique for Speech Enhancement	May 29, 2020	Speech Enhancement	—Unverified
SNRi Target Training for Joint Speech Enhancement and Recognition	Nov 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sparsity-Driven EEG Channel Selection for Brain-Assisted Speech Enhancement	Nov 22, 2023	channel selectionEEG	—Unverified
spatial-dccrn: dccrn equipped with frame-level angle feature and hybrid filtering for multi-channel speech enhancement	Oct 17, 2022	DenoisingSpeech Enhancement	—Unverified
Spatial-Filter-Bank-Based Neural Method for Multichannel Speech Enhancement	Apr 2, 2025	Speech Enhancement	—Unverified
Spatially constrained vs. unconstrained filtering in neural spatiospectral filters for multichannel speech enhancement	Jun 17, 2024	Speech Enhancement	—Unverified
Speaker independence of neural vocoders and their effect on parametric resynthesis speech enhancement	Nov 14, 2019	ResynthesisSpeech Enhancement	—Unverified
Speaker Recognition Based on Deep Learning: An Overview	Dec 2, 2020	Deep LearningDomain Adaptation	—Unverified
Speaker Re-identification with Speaker Dependent Speech Enhancement	May 15, 2020	Speaker RecognitionSpeech Enhancement	—Unverified
Speaker Reinforcement Using Target Source Extraction for Robust Automatic Speech Recognition	May 9, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speaking in Wavelet Domain: A Simple and Efficient Approach to Speed up Speech Diffusion Model	Feb 16, 2024	DenoisingSpeech Enhancement	—Unverified
SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral Shaping	Mar 31, 2022	DenoisingSpeech Enhancement	—Unverified
Spectral feature mapping with mimic loss for robust speech recognition	Mar 26, 2018	Robust Speech RecognitionSpeech Enhancement	—Unverified
Spectral Masking with Explicit Time-Context Windowing for Neural Network-Based Monaural Speech Enhancement	Aug 28, 2024	Speech Enhancement	—Unverified
Speech Bandwidth Expansion Via High Fidelity Generative Adversarial Networks	Jul 26, 2024	Generative Adversarial NetworkSpeech Enhancement	—Unverified
Speech Boosting: Low-Latency Live Speech Enhancement for TWS Earbuds	Sep 27, 2024	Speech Enhancement	—Unverified
SpeechComposer: Unifying Multiple Speech Tasks with Prompt Composition	Jan 31, 2024	DecoderLanguage Modeling	—Unverified
Speech-Declipping Transformer with Complex Spectrogram and Learnerble Temporal Features	Sep 19, 2024	Speech Enhancement	—Unverified
Speech denoising by parametric resynthesis	Apr 2, 2019	DenoisingResynthesis	—Unverified
Speech enhancement aided end-to-end multi-task learning for voice activity detection	Oct 23, 2020	Action DetectionActivity Detection	—Unverified
Speech Enhancement and Dereverberation with Diffusion-based Generative Models	Aug 11, 2022	Speech DereverberationSpeech Enhancement	—Unverified
Speech Enhancement-assisted Voice Conversion in Noisy Environments	Oct 19, 2021	Speech EnhancementVoice Conversion	—Unverified
Speech Enhancement Based on Cyclegan with Noise-informed Training	Oct 19, 2021	Speech Enhancement	—Unverified
Speech enhancement based on the integration of fully convolutional network, temporal lowpass filtering and spectrogram masking	Oct 1, 2019	Speech Enhancement	—Unverified
Speech enhancement deep-learning architecture for efficient edge processing	May 27, 2024	Deep LearningGenerative Adversarial Network	—Unverified
Speech Enhancement for Wake-Up-Word detection in Voice Assistants	Jan 29, 2021	Data AugmentationDenoising	—Unverified
Improving Speech Enhancement Performance by Leveraging Contextual Broad Phonetic Class Information	Nov 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Enhancement in Adverse Environments Based on Non-stationary Noise-driven Spectral Subtraction and SNR-dependent Phase Compensation	Feb 19, 2018	Noise EstimationSpeech Enhancement	—Unverified
Speech Enhancement Modeling Towards Robust Speech Recognition System	May 7, 2013	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Enhancement using Adaptive Mean Median Deviation and EMD Technique	Aug 26, 2019	Speech Enhancement	—Unverified
Speech Enhancement Using Continuous Embeddings of Neural Audio Codec	Feb 22, 2025	QuantizationSpeech Enhancement	—Unverified
Speech enhancement using ego-noise references with a microphone array embedded in an unmanned aerial vehicle	Nov 4, 2022	Speech Enhancement	—Unverified
Speech Enhancement Using Multi-Stage Self-Attentive Temporal Convolutional Networks	Feb 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Enhancement Using Pitch Detection Approach For Noisy Environment	May 9, 2013	Speech Enhancementspeech-recognition	—Unverified
Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention	Feb 14, 2020	Multi-Task LearningSpeaker Identification	—Unverified
Speech Enhancement Using Self-Supervised Pre-Trained Model and Vector Quantization	Sep 28, 2022	DecoderDenoising	—Unverified
Speech Enhancement using Separable Polling Attention and Global Layer Normalization followed with PReLU	May 6, 2021	Speech Enhancement	—Unverified
Speech enhancement with frequency domain auto-regressive modeling	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech enhancement with mixture-of-deep-experts with clean clustering pre-training	Feb 11, 2021	ClusteringSpeech Enhancement	—Unverified
Speech Enhancement with Multi-granularity Vector Quantization	Feb 16, 2023	DenoisingQuantization	—Unverified
Speech Enhancement with Perceptually-motivated Optimization and Dual Transformations	Sep 24, 2022	Speech Enhancement	—Unverified
Speech enhancement with variational autoencoders and alpha-stable distributions	Feb 8, 2019	Speech Enhancement	—Unverified
Speech-MLP: a simple MLP architecture for speech processing	Sep 29, 2021	Keyword SpottingSpeech Enhancement	—Unverified

Show:10 25 50

← PrevPage 12 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified