Audio Synthesis

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 127 papers

Title	Date	Tasks	Status
Supervising 3D Talking Head Avatars with Analysis-by-Audio-Synthesis	Apr 18, 2025	Audio Synthesis	—Unverified
TARO: Timestep-Adaptive Representation Alignment with Onset-Aware Conditioning for Synchronized Video-to-Audio Synthesis	Apr 8, 2025	Audio SynthesisFAD	—Unverified
Designing Neural Synthesizers for Low-Latency Interaction	Mar 14, 2025	Audio Synthesis	—Unverified
Long-Video Audio Synthesis with Multi-Agent Collaboration	Mar 13, 2025	Audio SynthesisScene Segmentation	—Unverified
Nexus: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision	Feb 26, 2025	Audio SynthesisAutomatic Speech Recognition	—Unverified
XAttnMark: Learning Robust Audio Watermarking with Cross-Attention	Feb 6, 2025	Audio SynthesisFace Swapping	—Unverified
Customized Condition Controllable Generation for Video Soundtrack	Jan 1, 2025	Audio Synthesis	—Unverified
Tri-Ergon: Fine-grained Video-to-Audio Generation with Multi-modal Conditions and LUFS Control	Dec 29, 2024	Audio GenerationAudio Synthesis	—Unverified
CSSinger: End-to-End Chunkwise Streaming Singing Voice Synthesis System Based on Conditional Variational Autoencoder	Dec 12, 2024	Audio SynthesisSinging Voice Synthesis	—Unverified
Zero-Shot Mono-to-Binaural Speech Synthesis	Dec 11, 2024	Audio SynthesisDenoising	—Unverified
Generalized Diffusion Model with Adjusted Offset Noise	Dec 4, 2024	Audio SynthesisDrug Discovery	—Unverified
VQalAttent: a Transparent Speech Generation Pipeline based on Transformer-learned VQ-VAE Latent Space	Nov 22, 2024	Audio SynthesisDecoder	—Unverified
Annotation-Free MIDI-to-Audio Synthesis via Concatenative Synthesis and Generative Refinement	Oct 22, 2024	Audio SynthesisDiversity	—Unverified
Array2BR: An End-to-End Noise-immune Binaural Audio Synthesis from Microphone-array Signals	Oct 8, 2024	Audio Synthesis	—Unverified
PTQ4ADM: Post-Training Quantization for Efficient Text Conditional Audio Diffusion Models	Sep 20, 2024	Audio GenerationAudio Synthesis	—Unverified
D-CAPTCHA++: A Study of Resilience of Deepfake CAPTCHA under Transferable Imperceptible Adversarial Attack	Sep 11, 2024	Adversarial AttackAudio Synthesis	—Unverified
Draw an Audio: Leveraging Multi-Instruction for Video-to-Audio Synthesis	Sep 10, 2024	Audio SynthesisAudio-Visual Synchronization	—Unverified
Fast, High-Quality and Parameter-Efficient Articulatory Synthesis using Differentiable DSP	Sep 4, 2024	Audio SynthesisComputational Efficiency	—Unverified
Hierarchical Generative Modeling of Melodic Vocal Contours in Hindustani Classical Music	Aug 22, 2024	Audio Synthesis	—Unverified
Video-Foley: Two-Stage Video-To-Sound Generation via Temporal Event Condition For Foley Sound	Aug 21, 2024	Audio GenerationAudio Synthesis	—Unverified
EgoSonics: Generating Synchronized Audio for Silent Egocentric Videos	Jul 30, 2024	Audio SynthesisVideo Summarization	—Unverified
Braille-to-Speech Generator: Audio Generation Based on Joint Fine-Tuning of CLIP and Fastspeech2	Jul 19, 2024	Audio GenerationAudio Synthesis	—Unverified
GROOT: Generating Robust Watermark for Diffusion-Model-Based Audio Synthesis	Jul 15, 2024	Audio SynthesisDecoder	—Unverified
AV-GS: Learning Material and Geometry Aware Priors for Novel View Acoustic Synthesis	Jun 13, 2024	Audio SynthesisNeRF	—Unverified
CodecFake: Enhancing Anti-Spoofing Models Against Deepfake Audios from Codec-Based Speech Synthesis Systems	Jun 11, 2024	Audio SynthesisFace Swapping	—Unverified
Creative Text-to-Audio Generation via Synthesizer Programming	Jun 1, 2024	Audio GenerationAudio Synthesis	—Unverified
Fill in the Gap! Combining Self-supervised Representation Learning with Neural Audio Synthesis for Speech Inpainting	May 30, 2024	Audio SynthesisRepresentation Learning	—Unverified
Text2Data: Low-Resource Data Generation with Textual Control	Feb 8, 2024	Audio SynthesisTime Series	—Unverified
Fast Diffusion GAN Model for Symbolic Music Generation Controlled by Emotions	Oct 21, 2023	Audio SynthesisGenerative Adversarial Network	—Unverified
Unified speech and gesture synthesis using flow matching	Oct 8, 2023	Audio SynthesisMotion Synthesis	—Unverified
Speech Audio Synthesis from Tagged MRI and Non-Negative Matrix Factorization via Plastic Transformer	Sep 26, 2023	Audio Synthesis	—Unverified
DDSP-SFX: Acoustically-guided sound effects generation with differentiable digital signal processing	Sep 14, 2023	AttributeAudio Synthesis	—Unverified
SnakeGAN: A Universal Vocoder Leveraging DDSP Prior Knowledge and Periodic Inductive Bias	Sep 14, 2023	Audio SynthesisGenerative Adversarial Network	—Unverified
CLIPSonic: Text-to-Audio Synthesis with Unlabeled Videos and Pretrained Language-Vision Models	Jun 16, 2023	Audio Synthesis	—Unverified
ECGAN: Self-supervised generative adversarial network for electrocardiography	Jan 23, 2023	Audio SynthesisDiversity	—Unverified
DopplerBAS: Binaural Audio Synthesis Addressing Doppler Effect	Dec 14, 2022	Audio Synthesis	—Unverified
Conditional variational autoencoder to improve neural audio synthesis for polyphonic music sound	Nov 16, 2022	Audio Synthesis	—Unverified
Anisotropic multiresolution analyses for deepfake detection	Oct 26, 2022	Audio SynthesisDeepFake Detection	—Unverified
Full-band General Audio Synthesis with Score-based Diffusion	Oct 26, 2022	Audio SynthesisDiversity	—Unverified
From Words to Sound: Neural Audio Synthesis of Guitar Sounds with Timbral Descriptors	Sep 17, 2022	Audio Synthesis	CodeCode Available
Evaluating generative audio systems and their metrics	Aug 31, 2022	Audio Synthesis	—Unverified
Convergence of denoising diffusion models under the manifold hypothesis	Aug 10, 2022	Audio SynthesisDenoising	—Unverified
Adversarial Audio Synthesis with Complex-valued Polynomial Networks	Jun 14, 2022	Audio GenerationAudio Synthesis	—Unverified
Tagged-MRI Sequence to Audio Synthesis via Self Residual Attention Guided Heterogeneous Translator	Jun 5, 2022	Audio SynthesisDisentanglement	—Unverified
BinauralGrad: A Two-Stage Conditional Diffusion Probabilistic Model for Binaural Audio Synthesis	May 30, 2022	Audio Synthesis	—Unverified
Streamable Neural Audio Synthesis With Non-Causal Convolutions	Apr 14, 2022	Audio GenerationAudio Synthesis	—Unverified
The Vicomtech Audio Deepfake Detection System based on Wav2Vec2 for the 2022 ADD Challenge	Mar 3, 2022	Audio Deepfake DetectionAudio Synthesis	—Unverified
Towards Lightweight Controllable Audio Synthesis with Conditional Implicit Neural Representations	Nov 14, 2021	Audio Synthesis	—Unverified
CAESynth: Real-Time Timbre Interpolation and Pitch Control with Conditional Autoencoders	Nov 9, 2021	Audio SynthesisMixed Reality	CodeCode Available
Estimating High Order Gradients of the Data Distribution by Denoising	Nov 8, 2021	Audio SynthesisDenoising	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.