SOTAVerified

Unconditional Molecule Generation

This task evaluates the ability of generative models to sample valid and realistic molecular structures.

The training dataset can be:

QM9 (Wu et al., 2018) - consists of 130,000 stable small organic molecules containing up to nine heavy atoms (C, N, O, F) along with hydrogens.
GEOM-DRUGS (Axelrod and Gómez-Bombarelli, 2022) - consistes of 430,000 large organic molecules of up to 180 atoms.

Following prior work (Hoogeboom et al., 2022), we generally sample 10,000 molecules and compute validity, uniqueness and Posebusters sanity checks (Buttenschoen et al., 2024) for molecules. Data is generally split following prior work (Hoogeboom et al., 2022, Vignac et al., 2023) to ensure fair comparisons.

Title	Date	Tasks	Status	Hype
All-atom Diffusion Transformers: Unified generative modelling of molecules and materials	Mar 5, 2025	AllUnconditional Crystal Generation	CodeCode Available	3
Geometric Representation Condition Improves Equivariant Molecule Generation	Oct 4, 2024	Drug Designscientific discovery	CodeCode Available	1
SemlaFlow -- Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching	Jun 11, 2024	3D GenerationDrug Design	—Unverified	0
Symphony: Symmetry-Equivariant Point-Centered Spherical Harmonics for 3D Molecule Generation	Nov 27, 2023	3D geometry3D Molecule Generation	CodeCode Available	1
Navigating the Design Space of Equivariant Diffusion-Based Generative Models for De Novo 3D Molecule Generation	Sep 29, 2023	3D Molecule GenerationDrug Discovery	—Unverified	0
Geometric Latent Diffusion Models for 3D Molecule Generation	May 2, 2023	3D Molecule GenerationUnconditional Molecule Generation	CodeCode Available	2
MiDi: Mixed Graph and 3D Denoising Diffusion for Molecule Generation	Feb 17, 2023	DenoisingUnconditional Molecule Generation	CodeCode Available	1
Equivariant Diffusion for Molecule Generation in 3D	Mar 31, 2022	Unconditional Molecule Generation	CodeCode Available	2

Title

Status

Hype

All-atom Diffusion Transformers: Unified generative modelling of molecules and materials

CodeCode Available

Geometric Representation Condition Improves Equivariant Molecule Generation

CodeCode Available

SemlaFlow -- Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching

—Unverified

Symphony: Symmetry-Equivariant Point-Centered Spherical Harmonics for 3D Molecule Generation

CodeCode Available

Navigating the Design Space of Equivariant Diffusion-Based Generative Models for De Novo 3D Molecule Generation

—Unverified

Geometric Latent Diffusion Models for 3D Molecule Generation

CodeCode Available

MiDi: Mixed Graph and 3D Denoising Diffusion for Molecule Generation

CodeCode Available

Equivariant Diffusion for Molecule Generation in 3D

CodeCode Available

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TABASCO	PoseBusters Validity	92	—	Unverified
2	SemlaFlow	PoseBusters Validity	87.5	—	Unverified
3	ADiT	PoseBusters Validity	85.3	—	Unverified
4	MiDi	Validity	77.8	—	Unverified
5	EQGAT-diff	PoseBusters Validity	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ADiT	Validity	94.45	—	Unverified
2	GeoLDM	Validity	93.8	—	Unverified
3	EDM	Validity	91.9	—	Unverified
4	Symphony	Validity	83.5	—	Unverified

Unconditional Molecule Generation

Papers

Benchmark Results