Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6326–6350 of 6689 papers

Title	Date	Tasks	Status
Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability	Apr 9, 2025	Image Generationmultimodal generation	—Unverified
Head and Neck Tumor Segmentation from [18F]F-FDG PET/CT Images Based on 3D Diffusion Model	Jan 31, 2024	Image GenerationSegmentation	—Unverified
HeadRouter: A Training-free Image Editing Framework for MM-DiTs by Adaptively Routing Attention Heads	Nov 22, 2024	Image Generationtext-guided-image-editing	—Unverified
Voltage-Controlled Magnetoelectric Devices for Neuromorphic Diffusion Process	Jul 17, 2024	Image Generation	—Unverified
Heat Death of Generative Models in Closed-Loop Learning	Apr 2, 2024	Image Generation	—Unverified
HepatoGEN: Generating Hepatobiliary Phase MRI with Perceptual and Adversarial Models	Apr 25, 2025	DenoisingDiagnostic	—Unverified
Heredity-aware Child Face Image Generation with Latent Space Disentanglement	Aug 25, 2021	DisentanglementImage Generation	—Unverified
HessianFR: An Efficient Hessian-based Follow-the-Ridge Algorithm for Minimax Optimization	May 23, 2022	Image Generation	—Unverified
Heuristics for Image Generation from Scene Graphs	Mar 20, 2019	Image GenerationImage Generation from Scene Graphs	—Unverified
Autoencoding Video Latents for Adversarial Video Generation	Jan 18, 2022	Image GenerationVideo Generation	—Unverified
Hide and Seek: How Does Watermarking Impact Face Recognition?	Apr 29, 2024	Data AugmentationDecoder	—Unverified
HiDiffusion: Unlocking Higher-Resolution Creativity and Efficiency in Pretrained Diffusion Models	Nov 29, 2023	AttributeImage Generation	—Unverified
Autoencoding Labeled Interpolator, Inferring Parameters From Image, And Image From Parameters	Dec 7, 2023	Image Generationparameter estimation	—Unverified
The Male CEO and the Female Assistant: Evaluation and Mitigation of Gender Biases in Text-To-Image Generation of Dual Subjects	Feb 16, 2024	FairnessImage Generation	—Unverified
The Myth of Culturally Agnostic AI Models	Nov 28, 2022	Image GenerationMemorization	—Unverified
Hierarchical Diffusion Autoencoders and Disentangled Image Manipulation	Apr 24, 2023	Image GenerationImage Manipulation	—Unverified
The Neural Painter: Multi-Turn Image Generation	Jun 16, 2018	BenchmarkingConditional Image Generation	—Unverified
Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian Mixture Models	Mar 3, 2024	DiversityImage Generation	—Unverified
Hierarchical Modes Exploring in Generative Adversarial Networks	Mar 5, 2020	DiversityImage Generation	—Unverified
Theoretical Insights into the Use of Structural Similarity Index In Generative Models and Inferential Autoencoders	Apr 4, 2020	Dimensionality ReductionImage Generation	—Unverified
Hierarchical Vision-Language Alignment for Text-to-Image Generation via Diffusion Models	Jan 1, 2025	Image GenerationText to Image Generation	—Unverified
HiFi Tuner: High-Fidelity Subject-Driven Fine-Tuning for Diffusion Models	Nov 30, 2023	DenoisingImage Generation	—Unverified
High-Fidelity Diffusion-based Image Editing	Dec 25, 2023	DenoisingImage Generation	—Unverified
High-fidelity Endoscopic Image Synthesis by Utilizing Depth-guided Neural Surfaces	Apr 20, 2024	Camera LocalizationDepth Estimation	—Unverified
High-Fidelity Guided Image Synthesis with Latent Diffusion Models	Nov 30, 2022	Image GenerationVocal Bursts Intensity Prediction	—Unverified

Show:10 25 50

← PrevPage 254 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified