Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 982 papers

Title	Date	Tasks	Status	Hype
Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement	Jan 19, 2020	Color ConstancyFace Detection	CodeCode Available	1
Improving GANs for Speech Enhancement	Jan 15, 2020	Speech Enhancement	CodeCode Available	1
Robust Speaker Recognition Using Speech Enhancement And Attention Model	Jan 14, 2020	Speaker IdentificationSpeaker Recognition	—Unverified	0
A Differentiable Perceptual Audio Metric Learned from Just Noticeable Differences	Jan 13, 2020	DenoisingSpeech Enhancement	CodeCode Available	1
Speech Enhancement based on Denoising Autoencoder with Multi-branched Encoders	Jan 6, 2020	DecoderDenoising	CodeCode Available	0
Monaural Speech Enhancement Using a Multi-Branch Temporal Convolutional Network	Dec 27, 2019	Speech Enhancement	—Unverified	0
Mixture of Inference Networks for VAE-based Audio-visual Speech Enhancement	Dec 23, 2019	DecoderSpeech Enhancement	—Unverified	0
High-quality Speech Synthesis Using Super-resolution Mel-Spectrogram	Dec 3, 2019	Image-to-Image TranslationSpeech Enhancement	—Unverified	0
Time-Domain Multi-modal Bone/air Conducted Speech Enhancement	Nov 22, 2019	Ensemble LearningSpeech Enhancement	—Unverified	0
MMTM: Multimodal Transfer Module for CNN Fusion	Nov 20, 2019	Action RecognitionAction Recognition In Videos	CodeCode Available	0
Distributed Microphone Speech Enhancement based on Deep Learning	Nov 19, 2019	AllDeep Learning	—Unverified	0
Sequential Multi-Frame Neural Beamforming for Speech Separation and Enhancement	Nov 18, 2019	Speaker SeparationSpeech Enhancement	—Unverified	0
Speaker independence of neural vocoders and their effect on parametric resynthesis speech enhancement	Nov 14, 2019	ResynthesisSpeech Enhancement	—Unverified	0
Robust Unsupervised Audio-visual Speech Enhancement Using a Mixture of Variational Autoencoders	Nov 10, 2019	Speech Enhancement	—Unverified	0
The Speed Submission to DIHARD II: Contributions & Lessons Learned	Nov 6, 2019	Action DetectionActivity Detection	—Unverified	0
Spleeter: A Fast And State-of-the Art Music Source Separation Tool With Pre-trained Models	Nov 4, 2019	GPUMusic Source Separation	CodeCode Available	1
What does a network layer hear? Analyzing hidden representations of end-to-end ASR through speech synthesis	Nov 4, 2019	Speaker VerificationSpeech Enhancement	CodeCode Available	0
Memory Requirement Reduction of Deep Neural Networks Using Low-bit Quantization of Parameters	Nov 1, 2019	QuantizationSpeech Enhancement	—Unverified	0
Does Speech enhancement of publicly available data help build robust Speech Recognition Systems?	Oct 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Feature Enhancement with Deep Feature Losses for Speaker Verification	Oct 25, 2019	DenoisingSpeaker Verification	CodeCode Available	0
A Recurrent Variational Autoencoder for Speech Enhancement	Oct 24, 2019	Speech Enhancement	—Unverified	0
Word-level Embeddings for Cross-Task Transfer Learning in Speech Processing	Oct 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
AeGAN: Time-Frequency Speech Denoising via Generative Adversarial Networks	Oct 21, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Comparative Study between Adversarial Networks and Classical Techniques for Speech Enhancement	Oct 21, 2019	Speech Enhancement	—Unverified	0
Multi-Talker MVDR Beamforming Based on Extended Complex Gaussian Mixture Model	Oct 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Semi-Supervised Multichannel Speech Enhancement With a Deep Speech Prior	Oct 7, 2019	Speech Enhancement	CodeCode Available	1
使用語者轉換技術於語音合成資料庫之音質改進(Speech Enhancement for TTS Speech Corpora by using Voice Conversion Technologies)	Oct 1, 2019	Speech EnhancementVoice Conversion	—Unverified	0
Speech enhancement based on the integration of fully convolutional network, temporal lowpass filtering and spectrogram masking	Oct 1, 2019	Speech Enhancement	—Unverified	0
AV Speech Enhancement Challenge using a Real Noisy Corpus	Sep 30, 2019	Speech Enhancement	—Unverified	0
FaSNet: Low-latency Adaptive Beamforming for Multi-microphone Audio Processing	Sep 29, 2019	Speech Enhancementspeech-recognition	CodeCode Available	1
Multichannel Speech Enhancement by Raw Waveform-mapping using Fully Convolutional Networks	Sep 26, 2019	DenoisingSpeech Enhancement	—Unverified	0
An Investigation into the Effectiveness of Enhancement in ASR Training and Test for CHiME-5 Dinner Party Transcription	Sep 26, 2019	Speech Enhancement	CodeCode Available	0
CochleaNet: A Robust Language-independent Audio-Visual Model for Speech Enhancement	Sep 23, 2019	Speech Enhancement	—Unverified	0
A scalable noisy speech dataset and online subjective test framework	Sep 17, 2019	Speech Enhancement	—Unverified	0
Spoken Speech Enhancement using EEG	Sep 13, 2019	EEGElectroencephalogram (EEG)	—Unverified	0
Generative Speech Enhancement Based on Cloned Networks	Sep 10, 2019	Speech Enhancement	—Unverified	0
On Loss Functions for Supervised Monaural Time-Domain Speech Enhancement	Sep 3, 2019	Deep LearningSpeech Enhancement	—Unverified	0
Speech Enhancement using Adaptive Mean Median Deviation and EMD Technique	Aug 26, 2019	Speech Enhancement	—Unverified	0
Coarse-to-fine Optimization for Speech Enhancement	Aug 21, 2019	Generative Adversarial NetworkSpeech Enhancement	—Unverified	0
A Dual-Staged Context Aggregation Method Towards Efficient End-To-End Speech Enhancement	Aug 18, 2019	Speech Enhancement	—Unverified	0
Audio-visual Speech Enhancement Using Conditional Variational Auto-Encoders	Aug 7, 2019	Speech Enhancement	—Unverified	0
Deep learning for minimum mean-square error approaches to speech enhancement	Aug 1, 2019	Deep LearningSpeech Enhancement	—Unverified	0
My lips are concealed: Audio-visual speech enhancement through obstructions	Jul 11, 2019	Speech Enhancement	—Unverified	0
Convolutional Neural Network-based Speech Enhancement for Cochlear Implant Recipients	Jul 3, 2019	Speech Enhancement	—Unverified	0
A Monaural Speech Enhancement Method for Robust Small-Footprint Keyword Spotting	Jun 20, 2019	Keyword SpottingSmall-Footprint Keyword Spotting	—Unverified	0
The Second DIHARD Diarization Challenge: Dataset, task, and baselines	Jun 18, 2019	Action DetectionActivity Detection	CodeCode Available	0
rVAD: An Unsupervised Segment-Based Robust Voice Activity Detection Method	Jun 9, 2019	Action DetectionActivity Detection	CodeCode Available	0
Increasing Compactness Of Deep Learning Based Speech Enhancement Models With Parameter Pruning And Quantization Techniques	May 31, 2019	DenoisingQuantization	—Unverified	0
Guided Source Separation Meets a Strong ASR Backend: Hitachi/Paderborn University Joint Investigation for Dinner Party ASR	May 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Deep-Learning-Based Audio-Visual Speech Enhancement in Presence of Lombard Effect	May 29, 2019	Speech Enhancement	—Unverified	0

Show:10 25 50

← PrevPage 17 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified