Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–2975 of 6689 papers

Title	Date	Tasks	Status
An Empirical Study of Batch Normalization and Group Normalization in Conditional Computation	Jul 31, 2019	Conditional Image GenerationFew-Shot Learning	—Unverified
Gradient-Free Textual Inversion	Apr 12, 2023	Computational EfficiencyCPU	—Unverified
Gradient-Free Classifier Guidance for Diffusion Model Sampling	Nov 23, 2024	Image GenerationText to Image Generation	—Unverified
Deep convolutional generative adversarial networks for traffic data imputation encoding time series as images	May 5, 2020	Decision MakingGenerative Adversarial Network	—Unverified
Deep Convolutional GANs for Car Image Generation	Jun 24, 2020	Image Generation	—Unverified
Hierarchical Modes Exploring in Generative Adversarial Networks	Mar 5, 2020	DiversityImage Generation	—Unverified
Gradient Domain Diffusion Models for Image Synthesis	Sep 5, 2023	Image Generation	—Unverified
Bias-Free FedGAN: A Federated Approach to Generate Bias-Free Datasets	Mar 17, 2021	Generative Adversarial NetworkImage Generation	—Unverified
3D Nephrographic Image Synthesis in CT Urography with the Diffusion Model and Swin Transformer	Feb 26, 2025	DiagnosticImage Generation	—Unverified
Deep Consensus Learning	Mar 15, 2021	Image GenerationSegmentation	—Unverified
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
HiFi Tuner: High-Fidelity Subject-Driven Fine-Tuning for Diffusion Models	Nov 30, 2023	DenoisingImage Generation	—Unverified
GPTDrawer: Enhancing Visual Synthesis through ChatGPT	Dec 11, 2024	Image GenerationKeyword Extraction	—Unverified
High-Fidelity Diffusion-based Image Editing	Dec 25, 2023	DenoisingImage Generation	—Unverified
High-fidelity Endoscopic Image Synthesis by Utilizing Depth-guided Neural Surfaces	Apr 20, 2024	Camera LocalizationDepth Estimation	—Unverified
High-Fidelity Guided Image Synthesis with Latent Diffusion Models	Nov 30, 2022	Image GenerationVocal Bursts Intensity Prediction	—Unverified
Deep Conditional HDRI: Inverse Tone Mapping via Dual Encoder-Decoder Conditioning Method	Mar 20, 2024	DecoderImage Generation	—Unverified
High-Fidelity Image Generation With Fewer Labels	Mar 6, 2019	Conditional Image GenerationImage Generation	—Unverified
High-Fidelity Image Synthesis from Pulmonary Nodule Lesion Maps using Semantic Diffusion Model	May 2, 2023	Image Generation	—Unverified
Improving face generation quality and prompt following with synthetic captions	May 17, 2024	Face GenerationImage Generation	—Unverified
Improving GANs with A Dynamic Discriminator	Sep 20, 2022	3D-Aware Image SynthesisData Augmentation	—Unverified
GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks	Nov 2, 2023	Image GenerationImage to text	—Unverified
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models	Oct 14, 2024	GPUImage Generation	—Unverified
GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning	Nov 21, 2023	Image GenerationText-to-Video Generation	—Unverified
DeepCFL: Deep Contextual Features Learning from a Single Image	Nov 7, 2020	Image GenerationImage Restoration	—Unverified

Show:10 25 50

← PrevPage 119 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified