Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2325 of 6689 papers

Title	Date	Tasks	Status
Generating a Temporally Coherent Visual Story by Multimodal Recurrent Transformers	Jan 16, 2022	Image GenerationSentence	—Unverified
DreamCube: 3D Panorama Generation via Multi-plane Synchronization	Jun 20, 2025	Depth EstimationImage Generation	—Unverified
DreamCom: Finetuning Text-guided Inpainting Model for Image Composition	Sep 27, 2023	Image GenerationImage Inpainting	—Unverified
Class-Prototype Conditional Diffusion Model with Gradient Projection for Continual Learning	Dec 10, 2023	Continual LearningDenoising	—Unverified
DreamCache: Finetuning-Free Lightweight Personalized Image Generation via Feature Caching	Nov 26, 2024	Image GenerationPersonalized Image Generation	—Unverified
Classifier-Free Guidance: From High-Dimensional Analysis to Generalized Guidance Forms	Feb 11, 2025	DiversityImage Generation	—Unverified
Adversarial Pseudo Healthy Synthesis Needs Pathology Factorization	Jan 10, 2019	Anomaly DetectionData Augmentation	—Unverified
Generating Counterfactual Trajectories with Latent Diffusion Models for Concept Discovery	Apr 16, 2024	counterfactualImage Generation	—Unverified
DreamBlend: Advancing Personalized Fine-tuning of Text-to-Image Diffusion Models	Nov 28, 2024	DiversityImage Generation	—Unverified
Classification under strategic adversary manipulation using pessimistic bilevel optimisation	Oct 26, 2024	Image GenerationMalware Detection	—Unverified
DreamArtist++: Controllable One-Shot Text-to-Image Generation via Positive-Negative Adapter	Nov 21, 2022	Image GenerationNovel Concepts	—Unverified
Dream3D: Zero-Shot Text-to-3D Synthesis Using 3D Shape Prior and Text-to-Image Diffusion Models	Dec 28, 2022	Image GenerationText to 3D	—Unverified
Classification Diffusion Models: Revitalizing Density Ratio Estimation	Feb 15, 2024	Audio GenerationClassification	—Unverified
A Robust Pose Transformational GAN for Pose Guided Person Image Synthesis	Jan 5, 2020	Data AugmentationForeground Segmentation	—Unverified
DRDM: A Disentangled Representations Diffusion Model for Synthesizing Realistic Person Images	Dec 25, 2024	Image GenerationPose Transfer	—Unverified
DRC: Enhancing Personalized Image Generation via Disentangled Representation Composition	Apr 24, 2025	DisentanglementImage Generation	—Unverified
Adversarial Pixel-Level Generation of Semantic Images	Jun 27, 2019	Image GenerationSemantic Segmentation	—Unverified
DrawingInStyles: Portrait Image Generation and Editing with Spatially Conditioned StyleGAN	Mar 5, 2022	Image Generation	—Unverified
Generating a Temporally Coherent Image Sequence for a Story by Multimodal Recurrent Transformers	Nov 16, 2021	Image GenerationSentence	—Unverified
Generating Diverse High-Resolution Images with VQ-VAE	Mar 27, 2019	DecoderDiversity	—Unverified
DragTraffic: Interactive and Controllable Traffic Scene Generation for Autonomous Driving	Apr 19, 2024	Autonomous DrivingDiversity	—Unverified
Clarifying MCMC-based training of modern EBMs : Contrastive Divergence versus Maximum Likelihood	Feb 24, 2022	Image Generation	—Unverified
Drag-guided diffusion models for vehicle image generation	Jun 16, 2023	DenoisingImage Generation	—Unverified
Draft-and-Revise: Effective Image Generation with Contextual RQ-Transformer	Jun 9, 2022	Conditional Image GenerationImage Generation	—Unverified
Circuit Complexity Bounds for Visual Autoregressive Model	Jan 8, 2025	Image Generationmodel	—Unverified

Show:10 25 50

← PrevPage 93 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified