SOTAVerified|Agents Browse Leaderboard About Blog

Text-to-Music Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 37 papers

Title	Date	Tasks	Status	Hype
FLUX that Plays Music	Sep 1, 2024	Music GenerationText-to-Music Generation	CodeCode Available	14
Stable Audio Open	Jul 19, 2024	Audio GenerationText-to-Music Generation	CodeCode Available	7
Fast Timing-Conditioned Latent Audio Diffusion	Feb 7, 2024	Audio GenerationGPU	CodeCode Available	7
Simple and Controllable Music Generation	Jun 8, 2023	Language ModelingLanguage Modelling	CodeCode Available	6
MusicLM: Generating Music From Text	Jan 26, 2023	Music GenerationText-to-Music Generation	CodeCode Available	6
Improving Text-To-Audio Models with Synthetic Captions	Jun 18, 2024	AudioCapsAudio captioning	CodeCode Available	5
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation	May 24, 2024	DiversityMusic Generation	CodeCode Available	4
AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining	Aug 10, 2023	Audio GenerationIn-Context Learning	CodeCode Available	4
Moûsai: Text-to-Music Generation with Long-Context Latent Diffusion	Jan 27, 2023	GPUImage Generation	CodeCode Available	4
TokenSynth: A Token-based Neural Synthesizer for Instrument Cloning and Text-to-Instrument	Feb 13, 2025	Audio GenerationDecoder	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 4Next →

All datasets MusicCaps MusicBench

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AudioLDM2-music	FD_openl3	354.05	—	Unverified
2	Stable Audio	FD_openl3	108.69	—	Unverified
3	Riffusion	FAD	13.4	—	Unverified
4	Mubert	FAD	9.6	—	Unverified
5	MeLoDy	FAD	5.41	—	Unverified
6	MusicGen w/ random melody (1.5B)	FAD	5	—	Unverified
7	MusicLM	FAD	4	—	Unverified
8	Noise2Music spectrogram	FAD	3.84	—	Unverified
9	MusicGen w/o melody (3.3B)	FAD	3.8	—	Unverified
10	UniAudio	FAD	3.65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mustango (non-pretrained)	FAD	2.09	—	Unverified