SOTAVerified|Agents Browse Leaderboard About Blog

FAD

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 62 papers

Title	Date	Tasks	Status	Hype
Efficient Autoregressive Audio Modeling via Next-Scale Prediction	Aug 16, 2024	Audio GenerationFAD	CodeCode Available	2
L4DR: LiDAR-4DRadar Fusion for Weather-Robust 3D Object Detection	Aug 7, 2024	3D Object DetectionAutonomous Navigation	CodeCode Available	2
Braille-to-Speech Generator: Audio Generation Based on Joint Fine-Tuning of CLIP and Fastspeech2	Jul 19, 2024	Audio GenerationAudio Synthesis	—Unverified	0
Taming Data and Transformers for Audio Generation	Jun 27, 2024	Audio captioningAudio Generation	CodeCode Available	2
Exploring compressibility of transformer based text-to-music (TTM) models	Jun 24, 2024	DecoderFAD	—Unverified	0
MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models	Jun 7, 2024	FADText-to-Music Generation	CodeCode Available	2
Reverse the auditory processing pathway: Coarse-to-fine audio reconstruction from fMRI	May 29, 2024	FAD	CodeCode Available	0
FAD-SAR: A Novel Fishing Activity Detection System via Synthetic Aperture Radar Images Based on Deep Learning Method	Apr 28, 2024	Action DetectionActivity Detection	—Unverified	0
FaceCat: Enhancing Face Recognition Security with a Unified Diffusion Model	Apr 14, 2024	Face Anti-SpoofingFace Recognition	—Unverified	0
Latent CLAP Loss for Better Foley Sound Synthesis	Mar 18, 2024	FAD	CodeCode Available	0
MOS-FAD: Improving Fake Audio Detection Via Automatic Mean Opinion Score Prediction	Jan 24, 2024	FAD	—Unverified	0
Audiobox: Unified Audio Generation with Natural Language Prompts	Dec 25, 2023	AudioCapsAudio Generation	—Unverified	0
Adapting Frechet Audio Distance for Generative Music Evaluation	Nov 2, 2023	FAD	CodeCode Available	2
Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis	Sep 21, 2023	FADInformation Retrieval	—Unverified	0
Retrieval-Augmented Text-to-Audio Generation	Sep 14, 2023	AudioCapsAudio Generation	—Unverified	0
AMSP-UOD: When Vortex Convolution and Stochastic Perturbation Meet Underwater Object Detection	Aug 23, 2023	FADObject	CodeCode Available	1
Flatness-Aware Minimization for Domain Generalization	Jul 20, 2023	Domain GeneralizationFAD	—Unverified	0
Feature Adversarial Distillation for Point Cloud Classification	Jun 25, 2023	ClassificationFAD	—Unverified	0
Adapting Offline Speech Translation Models for Streaming with Future-Aware Distillation and Inference	Mar 14, 2023	FADTranslation	CodeCode Available	0
A General Framework for Learning Procedural Audio Models of Environmental Sounds	Mar 4, 2023	FAD	—Unverified	0
Federated Automatic Differentiation	Jan 18, 2023	FADFederated Learning	—Unverified	0
CLOTH4D: A Dataset for Clothed Human Reconstruction	Jan 1, 2023	FAD	CodeCode Available	0
MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation	Dec 19, 2022	cross-modal alignmentDenoising	CodeCode Available	2
Refined Semantic Enhancement towards Frequency Diffusion for Video Captioning	Nov 28, 2022	FADVideo Captioning	CodeCode Available	0
A Fast Automatic Method for Deconvoluting Macro X-ray Fluorescence Data Collected from Easel Paintings	Oct 31, 2022	FAD	—Unverified	0

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.