Audio Synthesis

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 127 papers

Title	Date	Tasks	Status	Hype
MIDI-VALLE: Improving Expressive Piano Performance Synthesis Through Neural Codec Language Modelling	Jul 11, 2025	Audio SynthesisLanguage Modelling	—Unverified	0
Step-by-Step Video-to-Audio Synthesis via Negative Audio Guidance	Jun 26, 2025	Audio GenerationAudio Synthesis	—Unverified	0
Diffusion-Based Symbolic Regression	May 30, 2025	Audio SynthesisDenoising	—Unverified	0
SpecMaskFoley: Steering Pretrained Spectral Masked Generative Transformer Toward Synchronized Video-to-audio Synthesis via ControlNet	May 22, 2025	Audio Synthesis	—Unverified	0
Communication-Efficient Diffusion Denoising Parallelization via Reuse-then-Predict Mechanism	May 20, 2025	Audio SynthesisDenoising	—Unverified	0
DPN-GAN: Inducing Periodic Activations in Generative Adversarial Networks for High-Fidelity Audio Synthesis	May 14, 2025	Audio GenerationAudio Synthesis	—Unverified	0
Fast Differentiable Modal Simulation of Non-linear Strings, Membranes, and Plates	May 9, 2025	Audio SynthesisCPU	CodeCode Available	1
Supervising 3D Talking Head Avatars with Analysis-by-Audio-Synthesis	Apr 18, 2025	Audio Synthesis	—Unverified	0
TARO: Timestep-Adaptive Representation Alignment with Onset-Aware Conditioning for Synchronized Video-to-Audio Synthesis	Apr 8, 2025	Audio SynthesisFAD	—Unverified	0
Designing Neural Synthesizers for Low-Latency Interaction	Mar 14, 2025	Audio Synthesis	—Unverified	0
Long-Video Audio Synthesis with Multi-Agent Collaboration	Mar 13, 2025	Audio SynthesisScene Segmentation	—Unverified	0
Nexus: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision	Feb 26, 2025	Audio SynthesisAutomatic Speech Recognition	—Unverified	0
XAttnMark: Learning Robust Audio Watermarking with Cross-Attention	Feb 6, 2025	Audio SynthesisFace Swapping	—Unverified	0
Generative diffusion model with inverse renormalization group flows	Jan 15, 2025	Audio SynthesisDenoising	CodeCode Available	1
Customized Condition Controllable Generation for Video Soundtrack	Jan 1, 2025	Audio Synthesis	—Unverified	0
Tri-Ergon: Fine-grained Video-to-Audio Generation with Multi-modal Conditions and LUFS Control	Dec 29, 2024	Audio GenerationAudio Synthesis	—Unverified	0
MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis	Dec 19, 2024	Audio GenerationAudio Synthesis	CodeCode Available	7
CSSinger: End-to-End Chunkwise Streaming Singing Voice Synthesis System Based on Conditional Variational Autoencoder	Dec 12, 2024	Audio SynthesisSinging Voice Synthesis	—Unverified	0
Zero-Shot Mono-to-Binaural Speech Synthesis	Dec 11, 2024	Audio SynthesisDenoising	—Unverified	0
Generalized Diffusion Model with Adjusted Offset Noise	Dec 4, 2024	Audio SynthesisDrug Discovery	—Unverified	0
OmniFlow: Any-to-Any Generation with Multi-Modal Rectified Flows	Dec 2, 2024	Audio SynthesisImage Generation	CodeCode Available	2
VQalAttent: a Transparent Speech Generation Pipeline based on Transformer-learned VQ-VAE Latent Space	Nov 22, 2024	Audio SynthesisDecoder	—Unverified	0
Annotation-Free MIDI-to-Audio Synthesis via Concatenative Synthesis and Generative Refinement	Oct 22, 2024	Audio SynthesisDiversity	—Unverified	0
Array2BR: An End-to-End Noise-immune Binaural Audio Synthesis from Microphone-array Signals	Oct 8, 2024	Audio Synthesis	—Unverified	0
Where are we in audio deepfake detection? A systematic analysis over generative and detection models	Oct 6, 2024	Audio Deepfake DetectionAudio Synthesis	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 6Next →

No leaderboard results yet.