Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3326–3350 of 6689 papers

Title	Date	Tasks	Status
Traditional Classification Neural Networks are Good Generators: They are Competitive with DDPMs and GANs	Nov 27, 2022	Image GenerationText to Image Generation	—Unverified
Learning Universal Policies via Text-Guided Video Generation	Jan 31, 2023	Decision MakingImage Generation	—Unverified
Learning Unnormalized Statistical Models via Compositional Optimization	Jun 13, 2023	Density EstimationImage Generation	—Unverified
Learning Versatile 3D Shape Generation with Improved AR Models	Mar 26, 2023	3D Shape GenerationImage Generation	—Unverified
Learning Versatile 3D Shape Generation with Improved Auto-regressive Models	Jan 1, 2023	3D Shape GenerationImage Generation	—Unverified
Learning What and Where to Draw	Oct 8, 2016	Image GenerationText-to-Image Generation	—Unverified
LEDiff: Latent Exposure Diffusion for HDR Generation	Dec 19, 2024	Image Generation	—Unverified
LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance	Jul 2, 2023	Image Generation	—Unverified
Lesion Conditional Image Generation for Improved Segmentation of Intracranial Hemorrhage from CT Images	Mar 30, 2020	Computed Tomography (CT)Conditional Image Generation	—Unverified
Less is More: Unsupervised Mask-guided Annotated CT Image Synthesis with Minimum Manual Segmentations	Mar 19, 2023	Data AugmentationImage Generation	—Unverified
Weakly Supervised Annotations for Multi-modal Greeting Cards Dataset	Dec 1, 2022	Image CaptioningImage Generation	—Unverified
A Self-attention Guided Multi-scale Gradient GAN for Diversified X-ray Image Synthesis	Oct 9, 2022	DiversityImage Generation	—Unverified
Let's Go Shopping (LGS) -- Web-Scale Image-Text Dataset for Visual Concept Understanding	Jan 9, 2024	Image Captioningimage-classification	—Unverified
Let's Verify and Reinforce Image Generation Step by Step	Jan 1, 2025	Image Generation	—Unverified
Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation Evaluation	Jul 18, 2023	Image GenerationQuestion Answering	—Unverified
Density-aware Haze Image Synthesis by Self-Supervised Content-Style Disentanglement	Mar 11, 2021	DisentanglementImage Generation	—Unverified
Leveraging Generative AI Models to Explore Human Identity	Apr 19, 2025	Image Generation	—Unverified
Weakly Supervised Keypoint Discovery	Sep 28, 2021	Conditional Image GenerationImage Generation	—Unverified
Leveraging Previous Steps: A Training-free Fast Solver for Flow Diffusion	Nov 12, 2024	Image GenerationText to Image Generation	—Unverified
Weakly-Supervised Photo-realistic Texture Generation for 3D Face Reconstruction	Jun 14, 2021	3D Face ReconstructionFace Reconstruction	—Unverified
Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models	Mar 12, 2025	AttributeDiversity	—Unverified
Leveraging Text-to-Image Generation for Handling Spurious Correlation	Mar 21, 2025	image-classificationImage Classification	—Unverified
Leveraging Unpaired Data for Vision-Language Generative Models via Cycle Consistency	Oct 5, 2023	Image GenerationImage to text	—Unverified
Leveraging Vision-Language Foundation Models to Reveal Hidden Image-Attribute Relationships in Medical Imaging	Mar 30, 2025	AttributeImage Generation	—Unverified
Leveraging Visual Question Answering to Improve Text-to-Image Synthesis	Oct 28, 2020	Auxiliary LearningImage Generation	—Unverified

Show:10 25 50

← PrevPage 134 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified