Text-to-Music Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 37 papers

Title	Date	Tasks	Status	Hype
FLUX that Plays Music	Sep 1, 2024	Music GenerationText-to-Music Generation	CodeCode Available	14
Stable Audio Open	Jul 19, 2024	Audio GenerationText-to-Music Generation	CodeCode Available	7
Fast Timing-Conditioned Latent Audio Diffusion	Feb 7, 2024	Audio GenerationGPU	CodeCode Available	7
Simple and Controllable Music Generation	Jun 8, 2023	Language ModelingLanguage Modelling	CodeCode Available	6
MusicLM: Generating Music From Text	Jan 26, 2023	Music GenerationText-to-Music Generation	CodeCode Available	6
Improving Text-To-Audio Models with Synthetic Captions	Jun 18, 2024	AudioCapsAudio captioning	CodeCode Available	5
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation	May 24, 2024	DiversityMusic Generation	CodeCode Available	4
AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining	Aug 10, 2023	Audio GenerationIn-Context Learning	CodeCode Available	4
Moûsai: Text-to-Music Generation with Long-Context Latent Diffusion	Jan 27, 2023	GPUImage Generation	CodeCode Available	4
TokenSynth: A Token-based Neural Synthesizer for Instrument Cloning and Text-to-Instrument	Feb 13, 2025	Audio GenerationDecoder	CodeCode Available	2
ETTA: Elucidating the Design Space of Text-to-Audio Models	Dec 26, 2024	AudioCapsAudio captioning	CodeCode Available	2
Melody-Guided Music Generation	Sep 30, 2024	cross-modal alignmentMusic Generation	CodeCode Available	2
MusiConGen: Rhythm and Chord Control for Transformer-Based Text-to-Music Generation	Jul 21, 2024	DiversityMusic Generation	CodeCode Available	2
MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models	Jun 7, 2024	FADText-to-Music Generation	CodeCode Available	2
PAM: Prompting Audio-Language Models for Audio Quality Assessment	Feb 1, 2024	Audio Quality AssessmentMusic Generation	CodeCode Available	2
Mustango: Toward Controllable Text-to-Music Generation	Nov 14, 2023	Data AugmentationDenoising	CodeCode Available	2
Music Understanding LLaMA: Advancing Text-to-Music Generation with Question Answering and Captioning	Aug 22, 2023	Caption GenerationLarge Language Model	CodeCode Available	2
MusicMagus: Zero-Shot Text-to-Music Editing via Diffusion Models	Feb 9, 2024	Music GenerationText-to-Music Generation	CodeCode Available	1
The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation	Nov 16, 2023	Music CaptioningMusic Generation	CodeCode Available	1
Music ControlNet: A model similar to SD ControlNetD that can accurately control music generation	Nov 7, 2023	Music GenerationRhythm	CodeCode Available	1
Investigating Personalization Methods in Text to Music Generation	Sep 20, 2023	Data AugmentationMusic Generation	CodeCode Available	1
JEN-1: Text-Guided Universal Music Generation with Omnidirectional Diffusion Models	Aug 9, 2023	Computational EfficiencyIn-Context Learning	CodeCode Available	1
MusicLDM: Enhancing Novelty in Text-to-Music Generation Using Beat-Synchronous Mixup Strategies	Aug 3, 2023	Audio GenerationBeat Tracking	CodeCode Available	1
Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music Generation Task	Nov 21, 2022	Music GenerationText-to-Music Generation	CodeCode Available	1
MuseControlLite: Multifunctional Music Generation with Lightweight Conditioners	Jun 23, 2025	AttributeAudio inpainting	—Unverified	0

Show:10 25 50

← PrevPage 1 of 2Next →

All datasets MusicCaps MusicBench

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AudioLDM2-music	FD_openl3	354.05	—	Unverified
2	Stable Audio	FD_openl3	108.69	—	Unverified
3	Riffusion	FAD	13.4	—	Unverified
4	Mubert	FAD	9.6	—	Unverified
5	MeLoDy	FAD	5.41	—	Unverified
6	MusicGen w/ random melody (1.5B)	FAD	5	—	Unverified
7	MusicLM	FAD	4	—	Unverified
8	Noise2Music spectrogram	FAD	3.84	—	Unverified
9	MusicGen w/o melody (3.3B)	FAD	3.8	—	Unverified
10	UniAudio	FAD	3.65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mustango (non-pretrained)	FAD	2.09	—	Unverified