Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1626–1650 of 6689 papers

Title	Date	Tasks	Status	Hype
Continuous Language Generative Flow	Aug 1, 2021	Data AugmentationDensity Estimation	CodeCode Available	1
3D-Aware Semantic-Guided Generative Model for Human Synthesis	Dec 2, 2021	3D-Aware Image SynthesisImage Generation	CodeCode Available	1
DiffSketching: Sketch Control Image Synthesis with Diffusion Models	May 30, 2023	DiversityImage Generation	CodeCode Available	1
NVAE: A Deep Hierarchical Variational Autoencoder	Jul 8, 2020	Image Generation	CodeCode Available	1
DifFSS: Diffusion Model for Few-Shot Semantic Segmentation	Jul 3, 2023	Few-Shot Semantic SegmentationImage Generation	CodeCode Available	1
Flow Contrastive Estimation of Energy-Based Models	Dec 2, 2019	Image GenerationSemi-Supervised Image Classification	CodeCode Available	1
ForkGAN: Seeing into the Rainy Night	Aug 1, 2020	Image GenerationImage Segmentation	CodeCode Available	1
Generating images from caption and vice versa via CLIP-Guided Generative Latent Space Search	Feb 2, 2021	DescriptiveImage Generation	CodeCode Available	1
BS-Diff: Effective Bone Suppression Using Conditional Diffusion Models from Chest X-Ray Images	Nov 26, 2023	Image Generation	CodeCode Available	1
BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models	Dec 20, 2024	Bone Suppression From Dual Energy Chest X-RaysDiagnostic	CodeCode Available	1
Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces	Jun 9, 2025	Image GenerationText Generation	CodeCode Available	1
High Fidelity Image Synthesis With Deep VAEs In Latent Space	Mar 23, 2023	Image GenerationVocal Bursts Intensity Prediction	CodeCode Available	1
Unsupervised Sketch-to-Photo Synthesis	Sep 18, 2019	ColorizationData Augmentation	CodeCode Available	1
Continual Learning of Diffusion Models with Generative Distillation	Nov 23, 2023	Continual LearningDenoising	CodeCode Available	1
ConTEXTual Net: A Multimodal Vision-Language Model for Segmentation of Pneumothorax	Mar 2, 2023	DescriptiveImage Captioning	CodeCode Available	1
Attribute-guided image generation from layout	Aug 27, 2020	AttributeImage Generation	CodeCode Available	1
Contextual Convolutional Neural Networks	Aug 17, 2021	Generative Adversarial Networkimage-classification	CodeCode Available	1
Attribute Group Editing for Reliable Few-shot Image Generation	Mar 16, 2022	AttributeDictionary Learning	CodeCode Available	1
FlexDiT: Dynamic Token Density Control for Diffusion Transformer	Dec 8, 2024	Computational EfficiencyDenoising	CodeCode Available	1
Context-Aware Layout to Image Generation with Enhanced Object Appearance	Mar 22, 2021	Image GenerationLayout-to-Image Generation	CodeCode Available	1
FLAME Diffuser: Wildfire Image Synthesis using Mask Guided Diffusion	Mar 6, 2024	Fire DetectionImage Generation	CodeCode Available	1
Diffusion as Sound Propagation: Physics-inspired Model for Ultrasound Image Generation	Jul 7, 2024	Data AugmentationImage Generation	CodeCode Available	1
Anycost GANs for Interactive Image Synthesis and Editing	Mar 4, 2021	Image Generation	CodeCode Available	1
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation	Jun 18, 2024	AttributeFairness	CodeCode Available	1
FlexiFilm: Long Video Generation with Flexible Conditions	Apr 29, 2024	Image GenerationVideo Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 66 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified