Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 982 papers

Title	Date	Tasks	Status
Voice Activity Detection using Temporal Characteristics of Autocorrelation Lag and Maximum Spectral Amplitude in Sub-bands	Dec 1, 2014	Action DetectionActivity Detection	—Unverified
VoiceID Loss: Speech Enhancement for Speaker Verification	Apr 7, 2019	Speaker VerificationSpeech Enhancement	—Unverified
Vowel Enhancement in Early Stage Spanish Esophageal Speech Using Natural Glottal Flow Pulse and Vocal Tract Frequency Warping	Sep 1, 2015	Speech Enhancement	—Unverified
VSANet: Real-time Speech Enhancement Based on Voice Activity Detection and Causal Spatial Attention	Oct 11, 2023	Action DetectionActivity Detection	—Unverified
VSEGAN: Visual Speech Enhancement Generative Adversarial Network	Feb 4, 2021	Generative Adversarial NetworkSpeech Enhancement	—Unverified
Wav2code: Restore Clean Speech Representations via Codebook Lookup for Noise-Robust ASR	Apr 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Wav2vec-Switch: Contrastive Learning from Original-noisy Speech Pairs for Robust Speech Recognition	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weight, Block or Unit? Exploring Sparsity Tradeoffs for Speech Enhancement on Tiny Neural Accelerators	Nov 3, 2021	Model CompressionSpeech Enhancement	—Unverified
A weighted-variance variational autoencoder model for speech enhancement	Nov 2, 2022	Speech Enhancement	—Unverified
Zero-Shot Personalized Speech Enhancement through Speaker-Informed Model Selection	May 8, 2021	ClusteringDenoising	—Unverified
On Speech Pre-emphasis as a Simple and Inexpensive Method to Boost Speech Enhancement	Jan 17, 2024	Automatic Speech RecognitionSpeech Enhancement	—Unverified
Universal Sound Separation	May 8, 2019	Speech EnhancementSpeech Separation	—Unverified
CochleaNet: A Robust Language-independent Audio-Visual Model for Speech Enhancement	Sep 23, 2019	Speech Enhancement	—Unverified
A Bayesian Permutation training deep representation learning method for speech enhancement with variational autoencoder	Jan 24, 2022	Representation LearningSpeech Enhancement	—Unverified
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
A Closer Look at Wav2Vec2 Embeddings for On-Device Single-Channel Speech Enhancement	Mar 3, 2024	Automatic Speech RecognitionKeyword Spotting	—Unverified
A Comparative Evaluation of Deep Learning Models for Speech Enhancement in Real-World Noisy Environments	Jun 17, 2025	DenoisingSpeaker Recognition	—Unverified
A Composite Predictive-Generative Approach to Monaural Universal Speech Enhancement	May 30, 2025	DenoisingSpeech Enhancement	—Unverified
A Conformer-based ASR Frontend for Joint Acoustic Echo Cancellation, Speech Enhancement and Speech Separation	Nov 18, 2021	Acoustic echo cancellationAutomatic Speech Recognition	—Unverified
A consolidated view of loss functions for supervised deep learning-based speech enhancement	Sep 25, 2020	Speech Enhancement	—Unverified
Acoustic echo suppression using a learning-based multi-frame minimum variance distortionless response filter	May 7, 2022	parameter estimationSpeech Enhancement	—Unverified
Acoustics-guided evaluation (AGE): a new measure for estimating performance of speech enhancement algorithms for robust ASR	Nov 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic Structure Inverse Design and Optimization Using Deep Learning	Jan 29, 2021	Deep LearningSpeech Enhancement	—Unverified
Active Speech Enhancement: Active Speech Denoising Decliping and Deveraberation	May 22, 2025	DenoisingMamba	—Unverified
A Curriculum Learning Method for Improved Noise Robustness in Automatic Speech Recognition	Jun 22, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adaptive Dereverberation, Noise and Interferer Reduction Using Sparse Weighted Linearly Constrained Minimum Power Beamforming	Mar 13, 2023	Speech Enhancement	—Unverified
A Deep Representation Learning-based Speech Enhancement Method Using Complex Convolution Recurrent Variational Autoencoder	Dec 15, 2023	Representation LearningSpeech Enhancement	—Unverified
A deep representation learning speech enhancement method using β-VAE	May 11, 2022	DisentanglementRepresentation Learning	—Unverified
Artificial Intelligence for Cochlear Implants: Review of Strategies, Challenges, and Perspectives	Mar 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advanced Clustering Techniques for Speech Signal Enhancement: A Review and Metanalysis of Fuzzy C-Means, K-Means, and Kernel Fuzzy C-Means Methods	Sep 28, 2024	ClusteringSpeech Enhancement	—Unverified
Advances in Microphone Array Processing and Multichannel Speech Enhancement	Feb 13, 2025	Speech Enhancement	—Unverified
AdVerb: Visually Guided Audio Dereverberation	Aug 23, 2023	Speaker VerificationSpeech Enhancement	—Unverified
Adversarial Feature Learning and Unsupervised Clustering based Speech Synthesis for Found Data with Acoustic and Textual Noise	Apr 28, 2020	ClusteringData Augmentation	—Unverified
Adversarial Feature-Mapping for Speech Enhancement	Sep 6, 2018	Speech Enhancement	—Unverified
Adversarial Joint Training with Self-Attention Mechanism for Robust End-to-End Speech Recognition	Apr 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
多樣訊雜比之訓練語料於降噪自動編碼器其語音強化功能之初步研究 (A Preliminary Study of Various SNR-level Training Data in the Denoising Auto-encoder (DAE) Technique for Speech Enhancement) [In Chinese]	Nov 1, 2017	DenoisingSpeech Enhancement	—Unverified
以軟體為基礎建構語音增強系統使用者介面 (Development of a software-based User-Interface of Speech Enhancement System) [In Chinese]	Nov 1, 2017	Speech Enhancement	—Unverified
A Flow-Based Neural Network for Time Domain Speech Enhancement	Jun 16, 2021	Density EstimationSpeech Enhancement	—Unverified
A Framework for Unified Real-time Personalized and Non-Personalized Speech Enhancement	Feb 23, 2023	Multi-Task LearningSpeech Enhancement	—Unverified
A Fully Convolutional Neural Network Approach to End-to-End Speech Enhancement	Jul 20, 2018	Speech Enhancement	—Unverified
A Fused Deep Denoising Sound Coding Strategy for Bilateral Cochlear Implants	Oct 2, 2023	DenoisingSpeech Enhancement	—Unverified
All Information is Necessary: Integrating Speech Positive and Negative Information by Contrastive Learning for Speech Enhancement	Apr 26, 2023	AllContrastive Learning	—Unverified
A Low-Power Streaming Speech Enhancement Accelerator For Edge Devices	Mar 27, 2025	Model CompressionSpeech Enhancement	—Unverified
Sequential Multi-Frame Neural Beamforming for Speech Separation and Enhancement	Nov 18, 2019	Speaker SeparationSpeech Enhancement	—Unverified
A Meeting Transcription System for an Ad-Hoc Acoustic Sensor Network	May 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Model Compression Method with Matrix Product Operators for Speech Enhancement	Oct 10, 2020	Model CompressionSpeech Enhancement	—Unverified
A Monaural Speech Enhancement Method for Robust Small-Footprint Keyword Spotting	Jun 20, 2019	Keyword SpottingSmall-Footprint Keyword Spotting	—Unverified
Multimodal Audio-Visual Information Fusion using Canonical-Correlated Graph Neural Network for Energy-Efficient Speech Enhancement	Feb 9, 2022	Graph Neural NetworkRepresentation Learning	—Unverified
A Multiscale Autoencoder (MSAE) Framework for End-to-End Neural Network Speech Enhancement	Sep 21, 2023	Automatic Speech RecognitionSpeech Enhancement	—Unverified
Analysing Diffusion-based Generative Approaches versus Discriminative Approaches for Speech Restoration	Nov 4, 2022	Bandwidth ExtensionSpeech Denoising	—Unverified

Show:10 25 50

← PrevPage 15 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified