SOTAVerified|Agents Browse Leaderboard About Blog

FAD

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 62 papers

Title	Date	Tasks	Status	Hype	Score
Addressing Emotion Bias in Music Emotion Recognition and Generation with Frechet Audio Distance	Sep 23, 2024	Emotion RecognitionFAD	CodeCode Available	3	5
L4DR: LiDAR-4DRadar Fusion for Weather-Robust 3D Object Detection	Aug 7, 2024	3D Object DetectionAutonomous Navigation	CodeCode Available	2	5
FlowDec: A flow-based full-band general audio codec with high perceptual quality	Mar 3, 2025	FAD	CodeCode Available	2	5
MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation	Dec 19, 2022	cross-modal alignmentDenoising	CodeCode Available	2	5
Taming Data and Transformers for Audio Generation	Jun 27, 2024	Audio captioningAudio Generation	CodeCode Available	2	5
MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models	Jun 7, 2024	FADText-to-Music Generation	CodeCode Available	2	5
KAD: No More FAD! An Effective and Efficient Evaluation Metric for Audio Generation	Feb 21, 2025	Audio GenerationFAD	CodeCode Available	2	5
Efficient Autoregressive Audio Modeling via Next-Scale Prediction	Aug 16, 2024	Audio GenerationFAD	CodeCode Available	2	5
Adapting Frechet Audio Distance for Generative Music Evaluation	Nov 2, 2023	FAD	CodeCode Available	2	5
BemaGANv2: A Tutorial and Comparative Survey of GAN-based Vocoders for Long-Term Audio Generation	Jun 11, 2025	Audio GenerationFAD	CodeCode Available	1	5
AMSP-UOD: When Vortex Convolution and Stochastic Perturbation Meet Underwater Object Detection	Aug 23, 2023	FADObject	CodeCode Available	1	5
Aligning Text-to-Music Evaluation with Human Preferences	Mar 20, 2025	FAD	CodeCode Available	1	5
Enhance Generation Quality of Flow Matching V2A Model via Multi-Step CoT-Like Guidance and Combined Preference Optimization	Mar 28, 2025	Audio GenerationFAD	CodeCode Available	1	5
Timbre Transfer with Variational Auto Encoding and Cycle-Consistent Adversarial Networks	Sep 5, 2021	8kFAD	CodeCode Available	1	5
Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation	Dec 10, 2024	FADMusic Generation	CodeCode Available	1	5
DOSE : Drum One-Shot Extraction from Music Mixture	Apr 25, 2025	FAD	CodeCode Available	1	5
Multi-Source Music Generation with Latent Diffusion	Sep 10, 2024	FADMusic Generation	CodeCode Available	1	5
Representation Sharing for Fast Object Detector Search and Beyond	Jul 23, 2020	FADGPU	CodeCode Available	1	5
AnoPLe: Few-Shot Anomaly Detection via Bi-directional Prompt Learning with Only Normal Samples	Aug 24, 2024	Anomaly DetectionDecoder	CodeCode Available	0	5
Reverse the auditory processing pathway: Coarse-to-fine audio reconstruction from fMRI	May 29, 2024	FAD	CodeCode Available	0	5
CLOTH4D: A Dataset for Clothed Human Reconstruction	Jan 1, 2023	FAD	CodeCode Available	0	5
Adapting Offline Speech Translation Models for Streaming with Future-Aware Distillation and Inference	Mar 14, 2023	FADTranslation	CodeCode Available	0	5
Refined Semantic Enhancement towards Frequency Diffusion for Video Captioning	Nov 28, 2022	FADVideo Captioning	CodeCode Available	0	5
Latent CLAP Loss for Better Foley Sound Synthesis	Mar 18, 2024	FAD	CodeCode Available	0	5
Generating Diverse Vocal Bursts with StyleGAN2 and MEL-Spectrograms	Jun 25, 2022	FAD	CodeCode Available	0	5

Show:10 25 50

← PrevPage 1 of 3Next →

No leaderboard results yet.