Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 982 papers

Title	Date	Tasks	Status
Deep learning for minimum mean-square error approaches to speech enhancement	Aug 1, 2019	Deep LearningSpeech Enhancement	—Unverified
My lips are concealed: Audio-visual speech enhancement through obstructions	Jul 11, 2019	Speech Enhancement	—Unverified
Convolutional Neural Network-based Speech Enhancement for Cochlear Implant Recipients	Jul 3, 2019	Speech Enhancement	—Unverified
A Monaural Speech Enhancement Method for Robust Small-Footprint Keyword Spotting	Jun 20, 2019	Keyword SpottingSmall-Footprint Keyword Spotting	—Unverified
The Second DIHARD Diarization Challenge: Dataset, task, and baselines	Jun 18, 2019	Action DetectionActivity Detection	CodeCode Available
rVAD: An Unsupervised Segment-Based Robust Voice Activity Detection Method	Jun 9, 2019	Action DetectionActivity Detection	CodeCode Available
Increasing Compactness Of Deep Learning Based Speech Enhancement Models With Parameter Pruning And Quantization Techniques	May 31, 2019	DenoisingQuantization	—Unverified
Guided Source Separation Meets a Strong ASR Backend: Hitachi/Paderborn University Joint Investigation for Dinner Party ASR	May 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Deep-Learning-Based Audio-Visual Speech Enhancement in Presence of Lombard Effect	May 29, 2019	Speech Enhancement	—Unverified
A Perceptual Weighting Filter Loss for DNN Training in Speech Enhancement	May 23, 2019	Speech Enhancement	CodeCode Available
DNN-Based Speech Presence Probability Estimation for Multi-Frame Single-Microphone Speech Enhancement	May 21, 2019	Speech Enhancement	—Unverified
Universal Sound Separation	May 8, 2019	Speech EnhancementSpeech Separation	—Unverified
Learning with Learned Loss Function: Speech Enhancement with Quality-Net to Improve Perceptual Evaluation of Speech Quality	May 6, 2019	Speech Enhancement	CodeCode Available
A Statistically Principled and Computationally Efficient Approach to Speech Enhancement using Variational Autoencoders	May 3, 2019	Speech EnhancementVariational Inference	—Unverified
DEEP COMPLEX-VALUED NEURAL BEAMFORMERS	May 1, 2019	Speech Enhancement	CodeCode Available
Perceptually-motivated Environment-specific Speech Enhancement	May 1, 2019	Speech Enhancement	—Unverified
Incorporating Symbolic Sequential Modeling for Speech Enhancement	Apr 30, 2019	Language ModelingLanguage Modelling	—Unverified
Multi-Geometry Spatial Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Frequency Domain Multi-channel Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions	Apr 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Analysis of Speech Enhancement and Recognition Losses in Limited Resources Multi-talker Single Channel Audio-Visual ASR	Apr 16, 2019	Speech Enhancement	—Unverified
RHR-Net: A Residual Hourglass Recurrent Neural Network for Speech Enhancement	Apr 15, 2019	Speech Enhancement	CodeCode Available
VoiceID Loss: Speech Enhancement for Speaker Verification	Apr 7, 2019	Speaker VerificationSpeech Enhancement	—Unverified
Taco-VC: A Single Speaker Tacotron based Voice Conversion with Limited Data	Apr 6, 2019	Phoneme RecognitionSpeech Enhancement	—Unverified
Towards Generalized Speech Enhancement with Generative Adversarial Networks	Apr 6, 2019	Generative Adversarial NetworkSpeech Enhancement	—Unverified
Speech denoising by parametric resynthesis	Apr 2, 2019	DenoisingResynthesis	—Unverified
Unsupervised Speech Enhancement Based on Multichannel NMF-Informed Beamforming for Noise-Robust Automatic Speech Recognition	Mar 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridging the Gap Between Monaural Speech Enhancement and Recognition with Distortion-Independent Acoustic Modeling	Mar 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An improved uncertainty propagation method for robust i-vector based speaker recognition	Feb 15, 2019	Speaker RecognitionSpeaker Verification	—Unverified
Speech enhancement with variational autoencoders and alpha-stable distributions	Feb 8, 2019	Speech Enhancement	—Unverified
A variance modeling framework based on variational autoencoders for speech enhancement	Feb 5, 2019	Speech Enhancement	CodeCode Available
An Ensemble SVM-based Approach for Voice Activity Detection	Feb 5, 2019	Action DetectionActivity Detection	—Unverified
End-to-End Multi-Task Denoising for joint SDR and PESQ Optimization	Jan 26, 2019	DenoisingSpeech Enhancement	CodeCode Available
Deep Speech Enhancement for Reverberated and Noisy Signals using Wide Residual Networks	Jan 3, 2019	Speech Enhancementspeech-recognition	—Unverified
End-to-End Model for Speech Enhancement by Consistent Spectrogram Masking	Jan 2, 2019	Speech Enhancement	—Unverified
Tensor-Train Long Short-Term Memory for Monaural Speech Enhancement	Dec 25, 2018	Speech EnhancementSpeech Separation	—Unverified
Acoustics-guided evaluation (AGE): a new measure for estimating performance of speech enhancement algorithms for robust ASR	Nov 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improved Speech Enhancement with the Wave-U-Net	Nov 27, 2018	Audio Source SeparationSpeech Enhancement	CodeCode Available
Analysis of DNN Speech Signal Enhancement for Robust Speaker Recognition	Nov 19, 2018	Data AugmentationDenoising	—Unverified
Using recurrences in time and frequency within U-net architecture for speech enhancement	Nov 16, 2018	Speech Enhancement	—Unverified
Semi-supervised multichannel speech enhancement with variational autoencoders and non-negative matrix factorization	Nov 16, 2018	Speech Enhancement	—Unverified
Effects of Lombard Reflex on the Performance of Deep-Learning-Based Audio-Visual Speech Enhancement Systems	Nov 15, 2018	Deep LearningSpeech Enhancement	—Unverified
On Training Targets and Objective Functions for Deep-Learning-Based Audio-Visual Speech Enhancement	Nov 15, 2018	Deep LearningSpeech Enhancement	—Unverified
Reinforcement Learning Based Speech Enhancement for Robust Speech Recognition	Nov 10, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Enhancement Based on Reducing the Detail Portion of Speech Spectrograms in Modulation Domain via Discrete Wavelet Transform	Nov 8, 2018	Speech Enhancement	CodeCode Available
Kernel Machines Beat Deep Neural Networks on Mask-based Single-channel Speech Enhancement	Nov 6, 2018	regressionSpeech Enhancement	—Unverified
Unpaired Speech Enhancement by Acoustic and Adversarial Supervision for Speech Recognition	Nov 6, 2018	Generative Adversarial NetworkSpeech Enhancement	CodeCode Available
Face Landmark-based Speaker-Independent Audio-Visual Speech Enhancement in Multi-Talker Environments	Nov 6, 2018	Speech EnhancementSpeech Separation	CodeCode Available
Trainable Adaptive Window Switching for Speech Enhancement	Nov 5, 2018	Speech Enhancement	—Unverified
ConvS2S-VC: Fully convolutional sequence-to-sequence voice conversion	Nov 5, 2018	Speech EnhancementVoice Conversion	—Unverified

Show:10 25 50

← PrevPage 18 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified