Speech Enhancement

Speech Enhancement is a signal processing task that involves improving the quality of speech signals captured under noisy or degraded conditions. The goal of speech enhancement is to make speech signals clearer, more intelligible, and more pleasant to listen to, which can be used for various applications such as voice recognition, teleconferencing, and hearing aids. A representative Github project with online demo : ClearerVoice-Studio.

( Image credit: A Fully Convolutional Neural Network For Speech Enhancement )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 982 papers

Title	Date	Tasks	Status	Hype
Improving Speech Recognition on Noisy Speech via Speech Enhancement with Multi-Discriminators CycleGAN	Dec 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning-based personal speech enhancement for teleconferencing by exploiting spatial-spectral features	Dec 10, 2021	Speech EnhancementSpeech Extraction	—Unverified	0
Harmonic and non-Harmonic Based Noisy Reverberant Speech Enhancement in Time Domain	Dec 9, 2021	Speech Enhancement	—Unverified	0
A Training Framework for Stereo-Aware Speech Enhancement using Deep Neural Networks	Dec 9, 2021	Deep LearningSpeech Enhancement	—Unverified	0
使用低通時序列語音特徵訓練理想比率遮罩法之語音強化 (Employing Low-Pass Filtered Temporal Speech Features for the Training of Ideal Ratio Mask in Speech Enhancement)	Dec 1, 2021	Speech Enhancement	—Unverified	0
Effect of noise suppression losses on speech distortion and ASR performance	Nov 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dataset of Spatial Room Impulse Responses in a Variable Acoustics Room for Six Degrees-of-Freedom Rendering and Analysis	Nov 23, 2021	Speech Enhancement	—Unverified	0
Towards Intelligibility-Oriented Audio-Visual Speech Enhancement	Nov 18, 2021	Speech Enhancement	CodeCode Available	1
A Conformer-based ASR Frontend for Joint Acoustic Echo Cancellation, Speech Enhancement and Speech Separation	Nov 18, 2021	Acoustic echo cancellationAutomatic Speech Recognition	—Unverified	0
BLOOM-Net: Blockwise Optimization for Masking Networks Toward Scalable and Efficient Speech Enhancement	Nov 17, 2021	Speech Enhancement	CodeCode Available	0
Unsupervised Speech Enhancement with speech recognition embedding and disentanglement losses	Nov 16, 2021	DisentanglementSpeech Enhancement	—Unverified	0
S-DCCRN: Super Wide Band DCCRN with learnable complex feature for speech enhancement	Nov 16, 2021	16kDenoising	—Unverified	0
Joint Far- and Near-End Speech Intelligibility Enhancement based on the Approximated Speech Intelligibility Index	Nov 15, 2021	Speech Enhancement	—Unverified	0
Unsupervised Noise Adaptive Speech Enhancement by Discriminator-Constrained Optimal Transport	Nov 11, 2021	Domain AdaptationSpeech Enhancement	CodeCode Available	1
Uformer: A Unet based dilated complex & real dual-path conformer network for simultaneous speech enhancement and dereverberation	Nov 11, 2021	DecoderSpeech Enhancement	CodeCode Available	1
MultiSV: Dataset for Far-Field Multi-Channel Speaker Verification	Nov 11, 2021	DenoisingSpeaker Verification	CodeCode Available	1
OSSEM: one-shot speaker adaptive speech enhancement using meta learning	Nov 10, 2021	Meta-LearningSpeech Enhancement	—Unverified	0
Inter-channel Conv-TasNet for multichannel speech enhancement	Nov 8, 2021	Speech EnhancementSpeech Separation	—Unverified	0
SEOFP-NET: Compression and Acceleration of Deep Neural Networks for Speech Enhancement Using Sign-Exponent-Only Floating-Points	Nov 8, 2021	Model Compressionregression	—Unverified	0
Deep Noise Suppression Maximizing Non-Differentiable PESQ Mediated by a Non-Intrusive PESQNet	Nov 6, 2021	DenoisingSpeech Enhancement	—Unverified	0
Weight, Block or Unit? Exploring Sparsity Tradeoffs for Speech Enhancement on Tiny Neural Accelerators	Nov 3, 2021	Model CompressionSpeech Enhancement	—Unverified	0
Deep Learning-based Non-Intrusive Multi-Objective Speech Assessment Model with Cross-Domain Features	Nov 3, 2021	PredictionSpeech Enhancement	CodeCode Available	1
Reduction of Subjective Listening Effort for TV Broadcast Signals with Recurrent Neural Networks	Nov 2, 2021	Audio Source SeparationSpeech Enhancement	—Unverified	0
SNRi Target Training for Joint Speech Enhancement and Recognition	Nov 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cross-attention conformer for context modeling in speech enhancement for ASR	Oct 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Noise Robustness of Contrastive Speech Representation Learning with Speech Reconstruction	Oct 28, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Closing the Gap Between Time-Domain Multi-Channel Speech Enhancement on Real and Simulation Conditions	Oct 27, 2021	Speech Enhancementspeech-recognition	—Unverified	0
One model to enhance them all: array geometry agnostic multi-channel personalized speech enhancement	Oct 20, 2021	AllAutomatic Speech Recognition	—Unverified	0
Continual self-training with bootstrapped remixing for speech enhancement	Oct 19, 2021	Domain AdaptationSpeech Enhancement	CodeCode Available	1
Speech Enhancement-assisted Voice Conversion in Noisy Environments	Oct 19, 2021	Speech EnhancementVoice Conversion	—Unverified	0
Speech Enhancement Based on Cyclegan with Noise-informed Training	Oct 19, 2021	Speech Enhancement	—Unverified	0
Personalized Speech Enhancement: New Models and Comprehensive Evaluation	Oct 18, 2021	Speech Enhancementspeech-recognition	—Unverified	0
Similarity-and-Independence-Aware Beamformer with Iterative Casting and Boost Start for Target Source Extraction Using Reference	Oct 18, 2021	Speech Enhancementspeech-recognition	—Unverified	0
Toward Degradation-Robust Voice Conversion	Oct 14, 2021	DenoisingSpeech Enhancement	CodeCode Available	1
SpeechT5: Unified-Modal Encoder-Decoder Pre-Training for Spoken Language Processing	Oct 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Dual-branch Attention-In-Attention Transformer for single-channel speech enhancement	Oct 13, 2021	Speech Enhancement	CodeCode Available	1
Improving Character Error Rate Is Not Equal to Having Clean Speech: Speech Enhancement for ASR Systems with Black-box Acoustic Models	Oct 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MetricGAN-U: Unsupervised speech enhancement/ dereverberation based only on noisy/ reverberated speech	Oct 12, 2021	Speech Enhancement	CodeCode Available	1
DeepFilterNet: A Low Complexity Speech Enhancement Framework for Full-Band Audio based on Deep Filtering	Oct 11, 2021	Speech Enhancement	CodeCode Available	2
Wav2vec-Switch: Contrastive Learning from Original-noisy Speech Pairs for Robust Speech Recognition	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Interactive Feature Fusion for End-to-End Noise-Robust Speech Recognition	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Aura: Privacy-preserving Augmentation to Improve Test Set Diversity in Speech Enhancement	Oct 8, 2021	DiversityPrivacy Preserving	CodeCode Available	0
Lightweight Speech Enhancement in Unseen Noisy and Reverberant Conditions using KISS-GEV Beamforming	Oct 6, 2021	Speech Enhancement	—Unverified	0
PL-EESR: Perceptual Loss Based END-TO-END Robust Speaker Representation Extraction	Oct 3, 2021	Speaker IdentificationSpeaker Verification	CodeCode Available	0
End-to-End Complex-Valued Multidilated Convolutional Neural Network for Joint Acoustic Echo Cancellation and Noise Suppression	Oct 2, 2021	Acoustic echo cancellationSpeech Enhancement	—Unverified	0
Employing low-pass filtered temporal speech features for the training of ideal ratio mask in speech enhancement	Oct 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speech-MLP: a simple MLP architecture for speech processing	Sep 29, 2021	Keyword SpottingSpeech Enhancement	—Unverified	0
Masks Fusion with Multi-Target Learning For Speech Enhancement	Sep 23, 2021	Speech Enhancement	CodeCode Available	0
NORESQA: A Framework for Speech Quality Assessment using Non-Matching References	Sep 16, 2021	Speech Enhancement	CodeCode Available	1
DDS: A new device-degraded speech dataset for speech enhancement	Sep 16, 2021	DiversitySpeech Enhancement	—Unverified	0

Show:10 25 50

← PrevPage 12 of 20Next →

All datasets VoiceBank + DEMAND Deep Noise Suppression (DNS) Challenge CHiME-3 EARS-WHAM EasyCom DNS Challenge VB-DemandEx WHAMR!WSJ0 + DEMAND + RNNoise RealMAN VoiceBank+DEMAND DEMAND

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ROSE-CD(PESQ)	PESQ (wb)	3.99	—	Unverified
2	PESQetarian	PESQ (wb)	3.82	—	Unverified
3	Mamba-SEUNet L (+PCS)	PESQ (wb)	3.73	—	Unverified
4	Schrödinger bridge (PESQ loss)	PESQ (wb)	3.7	—	Unverified
5	SEMamba (+PCS)	PESQ (wb)	3.69	—	Unverified
6	ZipEnhancer (S, \lamba_6 = 0)	PESQ (wb)	3.63	—	Unverified
7	PrimeK-Net	PESQ (wb)	3.61	—	Unverified
8	ZipEnhancer (S, \lamba_6 = 0.2)	PESQ (wb)	3.61	—	Unverified
9	MP-SENet	PESQ (wb)	3.6	—	Unverified
10	PCS_CS_WAVLM	PESQ (wb)	3.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BSRNN-S + MGD	SI-SDR-WB	21.4	—	Unverified
2	DTLN	SI-SDR-WB	16.34	—	Unverified
3	Non-Real-Time MultiScale+	SI-SDR-WB	16.22	—	Unverified
4	ZipEnhancer (M)	PESQ-WB	3.81	—	Unverified
5	TF-Locoformer (M)	PESQ-WB	3.72	—	Unverified
6	ZipEnhancer (S)	PESQ-WB	3.69	—	Unverified
7	MambAttention	PESQ-WB	3.67	—	Unverified
8	MP-SENet	PESQ-WB	3.62	—	Unverified
9	xLSTM-SENet	PESQ-WB	3.59	—	Unverified
10	BSRNN-S + MRSD	PESQ-WB	3.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Inter-Channel Conv-TasNet	SDR	19.67	—	Unverified
2	CA Dense U-Net (Complex)	SDR	18.64	—	Unverified
3	Dense U-Net (Complex)	SDR	18.4	—	Unverified
4	Dense U-Net (Real)	SDR	16.86	—	Unverified
5	U-Net (Real)	SDR	15.97	—	Unverified
6	Noisy/unprocessed	SDR	6.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Schrödinger Bridge (PESQ loss)	PESQ-WB	3.09	—	Unverified
2	SGMSE+	PESQ-WB	2.5	—	Unverified
3	Demucs v4	PESQ-WB	2.37	—	Unverified
4	Schrödinger Bridge	PESQ-WB	2.33	—	Unverified
5	Conv-TasNet	PESQ-WB	2.31	—	Unverified
6	CDiffuSE	PESQ-WB	1.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReVISE (ch2)	Audio Quality MOS	4.19	—	Unverified
2	ReVISE (bf)	Audio Quality MOS	4.11	—	Unverified
3	Demucs (ch2)	Audio Quality MOS	2.95	—	Unverified
4	Demucs (bf)	Audio Quality MOS	2.39	—	Unverified
5	MaxDI (Baseline)	PESQ	1.17	—	Unverified
6	DAJA (MVDR,HMA,1000) (Overlapped Speech)	SDR	-4.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ZipEnhancer (M)	PESQ-NB	4.08	—	Unverified
2	DCCRN-MC	PESQ-NB	3.21	—	Unverified
3	DCCRN-M	PESQ-NB	3.15	—	Unverified
4	DCCRN	PESQ-NB	3.04	—	Unverified
5	RNN-Modulation	PESQ-WB	2.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MambAttention	ESTOI	0.8	—	Unverified
2	SEMamba	ESTOI	0.8	—	Unverified
3	xLSTM-SENet	ESTOI	0.8	—	Unverified
4	MP-SENet	ESTOI	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	2.84	—	Unverified
2	DTLN	PESQ	2.23	—	Unverified
3	Unprocessed	PESQ	1.83	—	Unverified
4	Non-Real-Time MultiScale+	PESQ	1.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DCUNet-MC	PESQ-NB	3.44	—	Unverified
2	DCCRN-M	PESQ-NB	3.28	—	Unverified
3	DCUNet	PESQ-NB	3.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CleanMel-L-map	DNSMOS	3.82	—	Unverified
2	SpatialNet	DNSMOS BAK	3.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	rose_cd(PESQ )	PESQ	3.99	—	Unverified
2	ROSE-CD	PESQ	3.49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wave-U-Net	CBAK	3.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	2.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SE-MelGAN	Audio Quality MOS	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeFT-AN	PESQ	3.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Audio-Visual concat-ref	PESQ	3.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SepFormer	PESQ	3.07	—	Unverified