Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6551–6575 of 6689 papers

Title	Date	Tasks	Status
WarpDiffusion: Efficient Diffusion Model for High-Fidelity Virtual Try-on	Dec 6, 2023	Image GenerationVirtual Try-on	—Unverified
Improved Texture Networks: Maximizing Quality and Diversity in Feed-forward Stylization and Texture Synthesis	Jan 9, 2017	DiversityImage Generation	—Unverified
Improved Training of Generative Adversarial Networks Using Representative Features	Jan 28, 2018	DiversityImage Generation	—Unverified
Improved Training of Mixture-of-Experts Language GANs	Feb 23, 2023	Adversarial TextImage Generation	—Unverified
Topological Perspectives on Optimal Multimodal Embedding Spaces	May 29, 2024	Image GenerationText to Image Generation	—Unverified
Improved Training with Curriculum GANs	Jul 24, 2018	Image Generation	—Unverified
Attention Guided Metal Artifact Correction in MRI using Deep Neural Networks	Oct 19, 2019	Image Generation	—Unverified
Improved Visual Story Generation with Adaptive Context Modeling	May 26, 2023	Image GenerationStory Generation	—Unverified
IMPROVE: Improving Medical Plausibility without Reliance on HumanValidation -- An Enhanced Prototype-Guided Diffusion Framework	Nov 26, 2024	Image GenerationMedical Image Generation	—Unverified
Improvements to SDXL in NovelAI Diffusion V3	Sep 24, 2024	Image Generation	—Unverified
Improving 3D-aware Image Synthesis with A Geometry-aware Discriminator	Sep 30, 2022	3D-Aware Image Synthesisdomain classification	—Unverified
Total Disentanglement of Font Images into Style and Character Class Features	Mar 19, 2024	DisentanglementFont Recognition	—Unverified
Improving AI-generated music with user-guided training	Jun 5, 2025	Image GenerationMusic Generation	—Unverified
Improving Augmentation and Evaluation Schemes for Semantic Image Synthesis	Nov 25, 2020	BenchmarkingData Augmentation	—Unverified
Improving Autoregressive Image Generation through Coarse-to-Fine Token Prediction	Mar 20, 2025	Image GenerationLanguage Modeling	—Unverified
Improving CNN Training using Disentanglement for Liver Lesion Classification in CT	Nov 1, 2018	DisentanglementGeneral Classification	—Unverified
Improving Compositional Text-to-image Generation with Large Vision-Language Models	Oct 10, 2023	AttributeImage Generation	—Unverified
Improving Cone-Beam CT Image Quality with Knowledge Distillation-Enhanced Diffusion Model in Imbalanced Data Settings	Sep 19, 2024	Computed Tomography (CT)Image Generation	—Unverified
Improving Denoising Diffusion Probabilistic Models via Exploiting Shared Representations	Nov 27, 2023	DenoisingFew-Shot Learning	—Unverified
Personalization as a Shortcut for Few-Shot Backdoor Attack against Text-to-Image Diffusion Models	May 18, 2023	Backdoor AttackImage Generation	—Unverified
Improving Diffusion-Based Image Editing Faithfulness via Guidance and Scheduling	Jun 26, 2025	Image GenerationScheduling	—Unverified
Improving Diffusion-Based Image Synthesis with Context Prediction	Jan 4, 2024	DecoderDenoising	—Unverified
Improving Editability in Image Generation with Layer-wise Memory	May 2, 2025	DisentanglementImage Generation	—Unverified
Improving face generation quality and prompt following with synthetic captions	May 17, 2024	Face GenerationImage Generation	—Unverified
Toward Accurate and Realistic Outfits Visualization with Attention to Details	Jun 11, 2021	Image GenerationVirtual Try-on	—Unverified

Show:10 25 50

← PrevPage 263 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified