Audio Super-Resolution

Audio super-resolution, especially speech, refers to the process of reconstructing high-resolution music signals from their low-resolution counterparts. Essentially, it enhances the quality of a speech signal by increasing its sampling rate or bandwidth while preserving naturalness and intelligibility. A representative Github project for speech super-resolution is ClearerVoice-Studio.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–22 of 22 papers

Title	Date	Tasks	Status	Hype	Score
AudioSR: Versatile Audio Super-resolution at Scale	Sep 13, 2023	Audio Super-ResolutionSuper-Resolution	CodeCode Available	3	5
CMGAN: Conformer-Based Metric-GAN for Monaural Speech Enhancement	Sep 22, 2022	Audio Super-ResolutionAutomatic Speech Recognition	CodeCode Available	2	5
AERO: Audio Super Resolution in the Spectral Domain	Nov 22, 2022	Audio Super-ResolutionBandwidth Extension	CodeCode Available	2	5
AEROMamba: An efficient architecture for audio super-resolution using generative adversarial networks and state space models	Nov 11, 2024	Audio Super-ResolutionGPU	CodeCode Available	2	5
NU-Wave 2: A General Neural Audio Upsampling Model for Various Sampling Rates	Jun 17, 2022	Audio Super-ResolutionSuper-Resolution	CodeCode Available	2	5
FLowHigh: Towards Efficient and High-Quality Audio Super-Resolution with Single-Step Flow Matching	Jan 9, 2025	Audio Super-ResolutionComputational Efficiency	CodeCode Available	2	5
TUNet: A Block-online Bandwidth Extension Model based on Transformers and Self-supervised Pretraining	Oct 26, 2021	Audio Super-ResolutionBandwidth Extension	CodeCode Available	1	5
Learning Continuous Representation of Audio for Arbitrary Scale Super Resolution	Oct 30, 2021	Audio Super-ResolutionSelf-Supervised Learning	CodeCode Available	1	5
Neural Vocoder is All You Need for Speech Super-resolution	Mar 28, 2022	AllAudio Super-Resolution	CodeCode Available	1	5
Nonparallel High-Quality Audio Super Resolution with Domain Adaptation and Resampling CycleGANs	Oct 28, 2022	Audio Super-ResolutionDomain Adaptation	CodeCode Available	1	5
NU-Wave: A Diffusion Probabilistic Model for Neural Audio Upsampling	Apr 6, 2021	Audio Super-ResolutionSuper-Resolution	CodeCode Available	1	5
On Filter Generalization for Music Bandwidth Extension Using Deep Neural Networks	Nov 14, 2020	Audio Super-ResolutionBandwidth Extension	CodeCode Available	1	5
Self-Attention for Audio Super-Resolution	Aug 26, 2021	Audio Super-ResolutionSuper-Resolution	CodeCode Available	1	5
Audio Super Resolution using Neural Networks	Aug 2, 2017	Audio GenerationAudio Super-Resolution	CodeCode Available	0	5
Temporal FiLM: Capturing Long-Range Sequence Dependencies with Feature-Wise Modulations	Sep 14, 2019	Audio Super-ResolutionSuper-Resolution	CodeCode Available	0	5
Temporal FiLM: Capturing Long-Range Sequence Dependencies with Feature-Wise Modulations.	Dec 1, 2019	Audio Super-ResolutionSuper-Resolution	CodeCode Available	0	5
Edge Storage Management Recipe with Zero-Shot Data Compression for Road Anomaly Detection	Jul 10, 2023	Anomaly DetectionAudio Compression	—Unverified	0	0
FlashSR: One-step Versatile Audio Super-resolution via Diffusion Distillation	Jan 18, 2025	Audio Super-ResolutionSuper-Resolution	—Unverified	0	0
Gull: A Generative Multifunctional Audio Codec	Apr 7, 2024	Audio CompressionAudio Source Separation	—Unverified	0	0
Learning to Have an Ear for Face Super-Resolution	Sep 27, 2019	Audio Super-ResolutionFace Reconstruction	—Unverified	0	0
Adversarial Audio Super-Resolution with Unsupervised Feature Losses	Sep 27, 2018	Audio Super-ResolutionImage Generation	—Unverified	0	0
An investigation of pre-upsampling generative modelling and Generative Adversarial Networks in audio super resolution	Sep 30, 2021	Audio GenerationAudio Super-Resolution	—Unverified	0	0

Show:10 25 50

All datasets VCTK Multi-Speaker Piano Voice Bank corpus (VCTK)DSD100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	U-Net	Log-Spectral Distance	3.1	—	Unverified
2	U-Net + TFiLM	Log-Spectral Distance	1.8	—	Unverified
3	U-Net + AFiLM	Log-Spectral Distance	1.7	—	Unverified
4	TUNet	Log-Spectral Distance	1.36	—	Unverified
5	TUNet + MSM pre-training	Log-Spectral Distance	1.28	—	Unverified
6	NVSR	Log-Spectral Distance	0.78	—	Unverified
7	CMGAN	Log-Spectral Distance	0.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	U-Net	Log-Spectral Distance	3.4	—	Unverified
2	U-Net + TFiLM	Log-Spectral Distance	2	—	Unverified
3	U-Net + AFiLM	Log-Spectral Distance	1.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	U-Net	Log-Spectral Distance	3.2	—	Unverified
2	U-Net + TFiLM	Log-Spectral Distance	2.5	—	Unverified
3	U-Net + AFiLM	Log-Spectral Distance	2.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	U-Net and ResNet	SNR	35.26	—	Unverified