Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 982 papers

Title	Date	Tasks	Status
Dense-TSNet: Dense Connected Two-Stage Structure for Ultra-Lightweight Speech Enhancement	Sep 18, 2024	MambaSpeech Enhancement	—Unverified
Design and Optimization of a Speech Recognition Front-End for Distant-Talking Control of a Music Playback Device	May 5, 2014	Speech Enhancementspeech-recognition	—Unverified
DeWinder: Single-Channel Wind Noise Reduction using Ultrasound Sensing	Sep 10, 2024	Speech Enhancement	—Unverified
DF-Conformer: Integrated architecture of Conv-TasNet and Conformer using linear complexity self-attention for speech enhancement	Jun 30, 2021	Computational EfficiencyDenoising	—Unverified
DFingerNet: Noise-Adaptive Speech Enhancement for Hearing Aids	Jan 17, 2025	DenoisingSpeech Enhancement	—Unverified
DFSNet: A Steerable Neural Beamformer Invariant to Microphone Array Configuration for Real-Time, Low-Latency Speech Enhancement	Feb 26, 2023	AttributeSpeech Enhancement	—Unverified
Dictionary-Based Fusion of Contact and Acoustic Microphones for Wind Noise Reduction	May 18, 2022	Speech Enhancement	—Unverified
Dictionary Update for NMF-based Voice Conversion Using an Encoder-Decoder Network	Oct 13, 2016	DecoderSpeech Enhancement	—Unverified
DiffPhase: Generative Diffusion-based STFT Phase Retrieval	Nov 8, 2022	ImputationRetrieval	—Unverified
Diffusion-based Generative Modeling with Discriminative Guidance for Streamable Speech Enhancement	Jun 19, 2024	Speech Enhancement	—Unverified
Diffusion-based Signal Refiner for Speech Separation	May 10, 2023	DenoisingSpeech Enhancement	—Unverified
Diffusion-Based Speech Enhancement in Matched and Mismatched Conditions Using a Heun-Based Sampler	Dec 5, 2023	Image GenerationSpeech Enhancement	—Unverified
Diffusion-based Speech Enhancement with Schrödinger Bridge and Symmetric Noise Schedule	Sep 8, 2024	Speech Enhancement	—Unverified
Diffusion-based speech enhancement with a weighted generative-supervised learning loss	Sep 19, 2023	Speech Enhancement	—Unverified
Diffusion-Based Speech Enhancement with Joint Generative and Predictive Decoders	May 18, 2023	DecoderSpeech Enhancement	—Unverified
Diffusion-based Unsupervised Audio-visual Speech Enhancement	Oct 4, 2024	Speech Enhancement	—Unverified
Diffusion Buffer: Online Diffusion-based Speech Enhancement with Sub-Second Latency	Jun 3, 2025	GPUSpeech Enhancement	—Unverified
DDTSE: Discriminative Diffusion Model for Target Speech Extraction	Sep 25, 2023	modelSpeech Enhancement	—Unverified
Diffusion Models for Audio Restoration	Feb 15, 2024	Speech Enhancement	—Unverified
Dilated U-net based approach for multichannel speech enhancement from First-Order Ambisonics recordings	Jun 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments	Jul 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distributed Microphone Speech Enhancement based on Deep Learning	Nov 19, 2019	AllDeep Learning	—Unverified
DiTSE: High-Fidelity Generative Speech Enhancement via Latent Diffusion Transformers	Apr 13, 2025	HallucinationSpeech Enhancement	—Unverified
DNN-Based Distributed Multichannel Mask Estimation for Speech Enhancement in Microphone Arrays	Feb 13, 2020	Speech Enhancement	—Unverified
DNN-Based Speech Presence Probability Estimation for Multi-Frame Single-Microphone Speech Enhancement	May 21, 2019	Speech Enhancement	—Unverified
DNN-Free Low-Latency Adaptive Speech Enhancement Based on Frame-Online Beamforming Powered by Block-Online FastMNMF	Jul 22, 2022	blind source separationSpeech Enhancement	—Unverified
Does Single-channel Speech Enhancement Improve Keyword Spotting Accuracy? A Case Study	Sep 27, 2023	Automatic Speech RecognitionKeyword Spotting	—Unverified
Does Speech enhancement of publicly available data help build robust Speech Recognition Systems?	Oct 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Downstream Task Agnostic Speech Enhancement with Self-Supervised Representation Loss	May 24, 2023	Self-Supervised LearningSpeech Enhancement	—Unverified
DPATD: Dual-Phase Audio Transformer for Denoising	Oct 30, 2023	DenoisingSpeech Enhancement	—Unverified
DPSNN: Spiking Neural Network for Low-Latency Streaming Speech Enhancement	Aug 14, 2024	Automatic Speech RecognitionSpeech Enhancement	—Unverified
An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions	Apr 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dual-Stage Low-Complexity Reconfigurable Speech Enhancement	May 17, 2021	Speech Enhancement	—Unverified
Dynamic Acoustic Compensation and Adaptive Focal Training for Personalized Speech Enhancement	Nov 22, 2022	Speech Enhancement	—Unverified
Dynamic Gated Recurrent Neural Network for Compute-efficient Speech Enhancement	Aug 22, 2024	Speech Enhancement	—Unverified
Dynamic Kernels and Channel Attention for Low Resource Speaker Verification	Nov 3, 2022	Speaker VerificationSpeech Enhancement	—Unverified
EDNet: A Distortion-Agnostic Speech Enhancement Framework with Gating Mamba Mechanism and Phase Shift-Invariant Training	Jun 19, 2025	Bandwidth ExtensionDenoising	—Unverified
非負矩陣分解法於語音調變頻譜強化之研究(A study of enhancing the modulation spectrum of speech signals via nonnegative matrix factorization)[In Chinese]	Oct 1, 2016	Speech Enhancement	—Unverified
EffCRN: An Efficient Convolutional Recurrent Network for High-Performance Speech Enhancement	Jun 5, 2023	Speech Enhancement	—Unverified
Effect of noise suppression losses on speech distortion and ASR performance	Nov 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Effects of Lombard Reflex on the Performance of Deep-Learning-Based Audio-Visual Speech Enhancement Systems	Nov 15, 2018	Deep LearningSpeech Enhancement	—Unverified
A Dual-Staged Context Aggregation Method Towards Efficient End-To-End Speech Enhancement	Aug 18, 2019	Speech Enhancement	—Unverified
Efficient Encoder-Decoder and Dual-Path Conformer for Comprehensive Feature Learning in Speech Enhancement	Jun 9, 2023	DecoderSpeech Enhancement	—Unverified
Efficient High-Performance Bark-Scale Neural Network for Residual Echo and Noise Suppression	Apr 8, 2024	Speech Enhancement	—Unverified
Efficient Low-Latency Speech Enhancement with Mobile Audio Streaming Networks	Aug 17, 2020	Speech Enhancement	—Unverified
Efficient Monaural Speech Enhancement using Spectrum Attention Fusion	Aug 4, 2023	Speech Enhancement	—Unverified
Efficient Trainable Front-Ends for Neural Speech Enhancement	Feb 20, 2020	Speech Enhancement	—Unverified
Efficient Transformer-based Speech Enhancement Using Long Frames and STFT Magnitudes	Jun 23, 2022	Speech EnhancementSpeech Separation	—Unverified
Egocentric Audio-Visual Noise Suppression	Nov 7, 2022	Action ClassificationEvent Detection	—Unverified
ELAICHI: Enhancing Low-resource TTS by Addressing Infrequent and Low-frequency Character Bigrams	Oct 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 19 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified