Audio Super-Resolution

Audio super-resolution, especially speech, refers to the process of reconstructing high-resolution music signals from their low-resolution counterparts. Essentially, it enhances the quality of a speech signal by increasing its sampling rate or bandwidth while preserving naturalness and intelligibility. A representative Github project for speech super-resolution is ClearerVoice-Studio.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 22 papers

Title	Date	Tasks	Status	Hype
FlashSR: One-step Versatile Audio Super-resolution via Diffusion Distillation	Jan 18, 2025	Audio Super-ResolutionSuper-Resolution	—Unverified	0
FLowHigh: Towards Efficient and High-Quality Audio Super-Resolution with Single-Step Flow Matching	Jan 9, 2025	Audio Super-ResolutionComputational Efficiency	CodeCode Available	2
AEROMamba: An efficient architecture for audio super-resolution using generative adversarial networks and state space models	Nov 11, 2024	Audio Super-ResolutionGPU	CodeCode Available	2
Gull: A Generative Multifunctional Audio Codec	Apr 7, 2024	Audio CompressionAudio Source Separation	—Unverified	0
AudioSR: Versatile Audio Super-resolution at Scale	Sep 13, 2023	Audio Super-ResolutionSuper-Resolution	CodeCode Available	3
Edge Storage Management Recipe with Zero-Shot Data Compression for Road Anomaly Detection	Jul 10, 2023	Anomaly DetectionAudio Compression	—Unverified	0
AERO: Audio Super Resolution in the Spectral Domain	Nov 22, 2022	Audio Super-ResolutionBandwidth Extension	CodeCode Available	2
Nonparallel High-Quality Audio Super Resolution with Domain Adaptation and Resampling CycleGANs	Oct 28, 2022	Audio Super-ResolutionDomain Adaptation	CodeCode Available	1
CMGAN: Conformer-Based Metric-GAN for Monaural Speech Enhancement	Sep 22, 2022	Audio Super-ResolutionAutomatic Speech Recognition	CodeCode Available	2
NU-Wave 2: A General Neural Audio Upsampling Model for Various Sampling Rates	Jun 17, 2022	Audio Super-ResolutionSuper-Resolution	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets VCTK Multi-Speaker Piano Voice Bank corpus (VCTK)DSD100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	U-Net	Log-Spectral Distance	3.1	—	Unverified
2	U-Net + TFiLM	Log-Spectral Distance	1.8	—	Unverified
3	U-Net + AFiLM	Log-Spectral Distance	1.7	—	Unverified
4	TUNet	Log-Spectral Distance	1.36	—	Unverified
5	TUNet + MSM pre-training	Log-Spectral Distance	1.28	—	Unverified
6	NVSR	Log-Spectral Distance	0.78	—	Unverified
7	CMGAN	Log-Spectral Distance	0.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	U-Net	Log-Spectral Distance	3.4	—	Unverified
2	U-Net + TFiLM	Log-Spectral Distance	2	—	Unverified
3	U-Net + AFiLM	Log-Spectral Distance	1.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	U-Net	Log-Spectral Distance	3.2	—	Unverified
2	U-Net + TFiLM	Log-Spectral Distance	2.5	—	Unverified
3	U-Net + AFiLM	Log-Spectral Distance	2.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	U-Net and ResNet	SNR	35.26	—	Unverified