Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 276–300 of 6689 papers

Title	Date	Tasks	Status	Hype
Towards SFW sampling for diffusion models via external conditioning	May 12, 2025	Image Generation	CodeCode Available	0
Image-Guided Microstructure Optimization using Diffusion Models: Validated with Li-Mn-rich Cathode Precursors	May 12, 2025	Image Generation	—Unverified	0
Unified Continuous Generative Models	May 12, 2025	Image Generation	CodeCode Available	2
Metrics that matter: Evaluating image quality metrics for medical image generation	May 12, 2025	Image GenerationMedical Image Generation	CodeCode Available	0
Selftok: Discrete Visual Tokens of Autoregression, by Diffusion, and for Reasoning	May 12, 2025	Image GenerationReinforcement Learning (RL)	—Unverified	0
Replay-Based Continual Learning with Dual-Layered Distillation and a Streamlined U-Net for Efficient Text-to-Image Generation	May 11, 2025	Continual LearningImage Generation	—Unverified	0
Learning Graph Representation of Agent Diffusers	May 10, 2025	Graph Neural NetworkImage Generation	CodeCode Available	0
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation	May 10, 2025	cross-modal alignmentImage Generation	CodeCode Available	0
Accelerating Diffusion Transformer via Increment-Calibrated Caching with Channel-Aware Singular Value Decomposition	May 9, 2025	Image Generation	CodeCode Available	1
Noise-Consistent Siamese-Diffusion for Medical Image Synthesis and Segmentation	May 9, 2025	Image GenerationImage Segmentation	CodeCode Available	2
A Preliminary Study for GPT-4o on Image Restoration	May 8, 2025	Image DehazingImage Generation	CodeCode Available	1
Normalize Everything: A Preconditioned Magnitude-Preserving Architecture for Diffusion-Based Speech Enhancement	May 8, 2025	Image GenerationSpeech Enhancement	—Unverified	0
InstanceGen: Image Generation with Instance-level Instructions	May 8, 2025	Image Generation	CodeCode Available	2
Prompt to Polyp: Medical Text-Conditioned Image Synthesis with Diffusion Models	May 8, 2025	Image Generation	CodeCode Available	0
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis	May 8, 2025	8kData Augmentation	—Unverified	0
Does CLIP perceive art the same way we do?	May 8, 2025	Image GenerationScene Understanding	—Unverified	0
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation	May 8, 2025	Image GenerationText Generation	—Unverified	0
PIDiff: Image Customization for Personalized Identities with Diffusion Models	May 8, 2025	Image GenerationText to Image Generation	—Unverified	0
Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers	May 7, 2025	Image GenerationLayout Generation	—Unverified	0
Efficient Flow Matching using Latent Variables	May 7, 2025	Conditional Image GenerationImage Generation	—Unverified	0
Unmasking the Canvas: A Dynamic Benchmark for Image Generation Jailbreaking and LLM Content Safety	May 7, 2025	Image GenerationPrompt Engineering	—Unverified	0
MAISY: Motion-Aware Image SYnthesis for Medical Image Motion Correction	May 7, 2025	Generative Adversarial NetworkImage Generation	—Unverified	0
CRAFT: Cultural Russian-Oriented Dataset Adaptation for Focused Text-to-Image Generation	May 7, 2025	Image GenerationText to Image Generation	—Unverified	0
CountDiffusion: Text-to-Image Synthesis with Training-Free Counting-Guidance Diffusion	May 7, 2025	DenoisingImage Generation	—Unverified	0
Defining and Quantifying Creative Behavior in Popular Image Generators	May 7, 2025	Image Generation	—Unverified	0

Show:10 25 50

← PrevPage 12 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified