Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 982 papers

Title	Date	Tasks	Status
A Study of Enhancement, Augmentation, and Autoencoder Methods for Domain Adaptation in Distant Speech Recognition	Jun 13, 2018	Data AugmentationDistant Speech Recognition	—Unverified
Consistency-aware multi-channel speech enhancement using deep neural networks	Feb 14, 2020	Speech Enhancement	—Unverified
Conditional Generative Adversarial Networks for Speech Enhancement and Noise-Robust Speaker Verification	Sep 6, 2017	Speaker VerificationSpeech Enhancement	—Unverified
A Statistically Principled and Computationally Efficient Approach to Speech Enhancement using Variational Autoencoders	May 3, 2019	Speech EnhancementVariational Inference	—Unverified
Assessing the Generalization Gap of Learning-Based Speech Enhancement Systems in Noisy and Reverberant Environments	Sep 12, 2023	Speech Enhancement	—Unverified
A Monaural Speech Enhancement Method for Robust Small-Footprint Keyword Spotting	Jun 20, 2019	Keyword SpottingSmall-Footprint Keyword Spotting	—Unverified
Advanced Clustering Techniques for Speech Signal Enhancement: A Review and Metanalysis of Fuzzy C-Means, K-Means, and Kernel Fuzzy C-Means Methods	Sep 28, 2024	ClusteringSpeech Enhancement	—Unverified
Complex spectrogram enhancement by convolutional neural network with multi-metrics learning	Apr 27, 2017	Speech Enhancement	—Unverified
Complex Spectral Mapping With Attention Based Convolution Recurrent Neural Network for Speech Enhancement	Apr 12, 2021	DecoderSpeech Enhancement	—Unverified
A Speech Production Model for Radar: Connecting Speech Acoustics with Radar-Measured Vibrations	Mar 19, 2025	Speech Enhancement	—Unverified
GenSE: Generative Speech Enhancement via Language Models using Hierarchical Modeling	Feb 5, 2025	Language ModelingLanguage Modelling	—Unverified
Generative Pre-training for Speech with Flow Matching	Oct 25, 2023	Speech EnhancementSpeech Synthesis	—Unverified
Comparison of remote experiments using crowdsourcing and laboratory experiments on speech intelligibility	Apr 17, 2021	Speech Enhancement	—Unverified
A Speech Intelligibility Enhancement Model based on Canonical Correlation and Deep Learning for Hearing-Assistive Technologies	Feb 8, 2022	Speech Enhancement	—Unverified
Comparative Study between Adversarial Networks and Classical Techniques for Speech Enhancement	Oct 21, 2019	Speech Enhancement	—Unverified
Comparative Analysis of Personalized Voice Activity Detection Systems: Assessing Real-World Effectiveness	Jun 12, 2024	Action DetectionActivity Detection	—Unverified
語音增強基於小腦模型控制器(A Speech Enhancement System Based on Cerebellar Model Articulation Controller) [In Chinese]	Oct 1, 2015	Speech Enhancement	—Unverified
Combining Spatial Clustering with LSTM Speech Models for Multichannel Speech Enhancement	Dec 2, 2020	ClusteringSpeech Enhancement	—Unverified
Full Attention Bidirectional Deep Learning Structure for Single Channel Speech Enhancement	Aug 27, 2021	Audio Signal ProcessingSpeech Enhancement	—Unverified
Collaborative Deep Learning for Speech Enhancement: A Run-Time Model Selection Method Using Autoencoders	May 29, 2017	Model SelectionSpeech Enhancement	—Unverified
A Single Speech Enhancement Model Unifying Dereverberation, Denoising, Speaker Counting, Separation, and Extraction	Oct 12, 2023	DenoisingSpeech Enhancement	—Unverified
A Model Compression Method with Matrix Product Operators for Speech Enhancement	Oct 10, 2020	Model CompressionSpeech Enhancement	—Unverified
Artificial Intelligence for Cochlear Implants: Review of Strategies, Challenges, and Perspectives	Mar 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A consolidated view of loss functions for supervised deep learning-based speech enhancement	Sep 25, 2020	Speech Enhancement	—Unverified
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
Frequency-Weighted Training Losses for Phoneme-Level DNN-based Speech Enhancement	Jun 23, 2025	Speech Enhancement	—Unverified
Frequency Gating: Improved Convolutional Neural Networks for Speech Enhancement in the Time-Frequency Domain	Nov 8, 2020	Speech Enhancement	—Unverified
Cold Diffusion for Speech Enhancement	Nov 4, 2022	Speech Enhancement	—Unverified
Frequency Domain Multi-channel Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
French Listening Tests for the Assessment of Intelligibility, Quality, and Identity of Body-Conducted Speech Enhancement	Jun 4, 2025	Bandwidth ExtensionSpeaker Identification	—Unverified
A Semantic Information-based Hierarchical Speech Enhancement Method Using Factorized Codec and Diffusion Model	May 20, 2025	Speech Enhancement	—Unverified
FlowAVSE: Efficient Audio-Visual Speech Enhancement with Conditional Flow Matching	Jun 13, 2024	Speech Enhancement	—Unverified
Coarse-to-fine Optimization for Speech Enhancement	Aug 21, 2019	Generative Adversarial NetworkSpeech Enhancement	—Unverified
A scalable noisy speech dataset and online subjective test framework	Sep 17, 2019	Speech Enhancement	—Unverified
Flexible Multichannel Speech Enhancement for Noise-Robust Frontend	Jun 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
FINALLY: fast and universal speech enhancement with studio-like quality	Oct 8, 2024	Speech Enhancement	—Unverified
GAN-Based Speech Enhancement for Low SNR Using Latent Feature Conditioning	Oct 17, 2024	Generative Adversarial NetworkSpeech Enhancement	—Unverified
Gated Recurrent Fusion with Joint Training Framework for Robust End-to-End Speech Recognition	Nov 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Generalized Fast Multichannel Nonnegative Matrix Factorization Based on Gaussian Scale Mixtures for Blind Source Separation	May 11, 2022	blind source separationSpeech Enhancement	—Unverified
Generative Data Augmentation Challenge: Zero-Shot Speech Synthesis for Personalized Speech Enhancement	Jan 23, 2025	Data AugmentationSpeech Enhancement	—Unverified
FFC-SE: Fast Fourier Convolution for Speech Enhancement	Apr 6, 2022	Speech Enhancement	—Unverified
Generative Speech Enhancement Based on Cloned Networks	Sep 10, 2019	Speech Enhancement	—Unverified
Feature Normalization for Fine-tuning Self-Supervised Models in Speech Enhancement	Jun 14, 2023	Self-Supervised LearningSpeech Enhancement	—Unverified
Geometry-Constrained EEG Channel Selection for Brain-Assisted Speech Enhancement	Sep 19, 2024	channel selectionEEG	—Unverified
GhostRNN: Reducing State Redundancy in RNN with Cheap Operations	Nov 20, 2024	Keyword SpottingSpeech Enhancement	—Unverified
GIST-AiTeR System for the Diarization Task of the 2022 VoxCeleb Speaker Recognition Challenge	Sep 21, 2022	Action DetectionActivity Detection	—Unverified
GLD-Net: Improving Monaural Speech Enhancement by Learning Global and Local Dependency Features with GLD Block	Jun 30, 2022	DecoderSpeech Enhancement	—Unverified
Closing the Gap Between Time-Domain Multi-Channel Speech Enhancement on Real and Simulation Conditions	Oct 27, 2021	Speech Enhancementspeech-recognition	—Unverified
Artifact-free Sound Quality in DNN-based Closed-loop Systems for Audio Processing	Jan 7, 2025	Speech Enhancement	—Unverified
FB-MSTCN: A Full-Band Single-Channel Speech Enhancement Method Based on Multi-Scale Temporal Convolutional Network	Mar 15, 2022	DenoisingSpeech Denoising	—Unverified

Show:10 25 50

← PrevPage 8 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified