Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5326–5350 of 6689 papers

Title	Date	Tasks	Status
Subject-driven Text-to-Image Generation via Apprenticeship Learning	Apr 1, 2023	Image GenerationIn-Context Learning	—Unverified
You Only Submit One Image to Find the Most Suitable Generative Model	Dec 16, 2024	Image GenerationText Matching	—Unverified
DiffUMI: Training-Free Universal Model Inversion via Unconditional Diffusion for Face Recognition	Apr 25, 2025	Face GenerationFace Recognition	—Unverified
Bridging CLIP and StyleGAN through Latent Alignment for Image Editing	Oct 10, 2022	Image GenerationImage Manipulation	—Unverified
BRIDGING ADVERSARIAL SAMPLES AND ADVERSARIAL NETWORKS	Sep 25, 2019	DiversityImage Generation	—Unverified
Vision-Language Models Represent Darker-Skinned Black Individuals as More Homogeneous than Lighter-Skinned Black Individuals	Dec 12, 2024	Image CaptioningImage Generation	—Unverified
Bridge Diffusion Model: bridge non-English language-native text-to-image diffusion model with English communities	Sep 2, 2023	Image Generationmodel	—Unverified
SuperNeRF-GAN: A Universal 3D-Consistent Super-Resolution Framework for Efficient and Enhanced 3D-Aware Image Synthesis	Jan 12, 2025	3D-Aware Image SynthesisImage Generation	—Unverified
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified
DiffusionGPT: LLM-Driven Text-to-Image Generation System	Jan 18, 2024	Image GenerationModel Selection	—Unverified
Diffusion idea exploration for art generation	Jul 11, 2023	Generative Adversarial NetworkImage Generation	—Unverified
Your Autoregressive Generative Model Can be Better If You Treat It as an Energy-Based One	Jun 26, 2022	Image GenerationLanguage Modeling	—Unverified
Diffusion Instruction Tuning	Feb 4, 2025	Image Generation	—Unverified
Diffusion Lens: Interpreting Text Encoders in Text-to-Image Pipelines	Mar 9, 2024	Image GenerationRetrieval	—Unverified
BraSyn 2023 challenge: Missing MRI synthesis and the effect of different learning objectives	Mar 12, 2024	Brain Tumor SegmentationDeep Learning	—Unverified
Diffusion Model Conditioning on Gaussian Mixture Model and Negative Gaussian Mixture Gradient	Jan 20, 2024	DenoisingDiversity	—Unverified
Supervised Adversarial Networks for Image Saliency Detection	Apr 24, 2017	Generative Adversarial NetworkImage Generation	—Unverified
Diffusion Models as Data Mining Tools	Jul 20, 2024	Image Generation	—Unverified
PanoFree: Tuning-Free Holistic Multi-view Image Generation with Cross-view Self-Guidance	Aug 4, 2024	GPUImage Generation	—Unverified
BrainSCUBA: Fine-Grained Natural Language Captions of Visual Cortex Selectivity	Oct 6, 2023	Image GenerationLanguage Modeling	—Unverified
Diffusion Models Enable Zero-Shot Pose Estimation for Lower-Limb Prosthetic Users	Dec 13, 2023	Image GenerationPose Estimation	—Unverified
Vision Reimagined: AI-Powered Breakthroughs in WiFi Indoor Imaging	Jan 9, 2024	Image Generation	—Unverified
Diffusion models for Gaussian distributions: Exact solutions and Wasserstein errors	May 23, 2024	Gaussian ProcessesImage Generation	—Unverified
Surf-CDM: Score-Based Surface Cold-Diffusion Model For Medical Image Segmentation	Dec 19, 2023	DenoisingImage Denoising	—Unverified
Brain Image Synthesis With Unsupervised Multivariate Canonical CSCl4Net	Jun 19, 2021	Image Generation	—Unverified

Show:10 25 50

← PrevPage 214 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified