Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4526–4550 of 6689 papers

Title	Date	Tasks	Status
Validation of Simulation-Based Testing: Bypassing Domain Shift with Label-to-Image Synthesis	Jun 10, 2021	Image GenerationMulti-class Classification	—Unverified
Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation	Jan 9, 2025	DiversityImage Generation	—Unverified
Seeing Syntax: Uncovering Syntactic Learning Limitations in Vision-Language Models	Dec 11, 2024	Image CaptioningImage Generation	—Unverified
Seek for Incantations: Towards Accurate Text-to-Image Diffusion Synthesis through Prompt Engineering	Jan 12, 2024	Image GenerationPrompt Engineering	—Unverified
Beyond Inserting: Learning Identity Embedding for Semantic-Fidelity Personalized Diffusion Generation	Jan 31, 2024	Image GenerationPersonalized Image Generation	—Unverified
seg2med: a bridge from artificial anatomy to multimodal medical images	Apr 12, 2025	AnatomyData Augmentation	—Unverified
SegAttnGAN: Text to Image Generation with Segmentation Attention	May 25, 2020	Image GenerationSegmentation	—Unverified
VaLID: Variable-Length Input Diffusion for Novel View Synthesis	Dec 14, 2023	Image GenerationNovel View Synthesis	—Unverified
SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis	Nov 6, 2023	DiversityImage Generation	—Unverified
Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties	Mar 19, 2024	Image GenerationSemantic Segmentation	—Unverified
Segmentation-Reconstruction-Guided Facial Image De-occlusion	Dec 15, 2021	3D Face ReconstructionFace Reconstruction	—Unverified
SEIGAN: Towards Compositional Image Generation by Simultaneously Learning to Segment, Enhance, and Inpaint	Nov 19, 2018	Generative Adversarial NetworkImage Generation	—Unverified
PixCell: A generative foundation model for digital histopathology images	Jun 5, 2025	Cell SegmentationData Augmentation	—Unverified
Self-conditioned Embedding Diffusion for Text Generation	Nov 8, 2022	Image GenerationLanguage Modeling	—Unverified
Self-control: A Better Conditional Mechanism for Masked Autoregressive Model	Dec 18, 2024	Conditional Image GenerationImage Generation	—Unverified
PSDiffusion: Harmonized Multi-Layer Image Generation via Layout and Appearance Alignment	May 16, 2025	Image GenerationText to Image Generation	—Unverified
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects	Nov 28, 2024	Image Generation	—Unverified
Variational autoencoder-based neural network model compression	Aug 25, 2024	Anomaly DetectionImage Generation	—Unverified
Self-Guidance: Boosting Flow and Diffusion Generation on Their Own	Dec 8, 2024	Image GenerationText to Image Generation	—Unverified
Variational Autoencoders Without the Variation	Mar 1, 2022	Image Generation	—Unverified
Self-Improving Diffusion Models with Synthetic Data	Aug 29, 2024	FairnessImage Generation	—Unverified
Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation	Feb 15, 2024	Image GenerationReinforcement Learning (RL)	—Unverified
Variational Bayesian Framework for Advanced Image Generation with Domain-Related Variables	May 23, 2023	Image GenerationImage-to-Image Translation	—Unverified
Adversarial Identity Injection for Semantic Face Image Synthesis	Apr 16, 2024	Adversarial AttackFace Generation	—Unverified
Self-Rewarding Large Vision-Language Models for Optimizing Prompts in Text-to-Image Generation	May 22, 2025	Image GenerationText to Image Generation	—Unverified

Show:10 25 50

← PrevPage 182 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified