Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5976–6000 of 6689 papers

Title	Date	Tasks	Status
Focusing Image Generation to Mitigate Spurious Correlations	Dec 27, 2024	AttributeData Augmentation	—Unverified
Focus-N-Fix: Region-Aware Fine-Tuning for Text-to-Image Generation	Jan 11, 2025	Image GenerationText to Image Generation	—Unverified
Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN	Aug 3, 2023	Image GenerationImage Reconstruction	—Unverified
Benefiting Deep Latent Variable Models via Learning the Prior and Removing Latent Regularization	Jul 7, 2020	DisentanglementDiversity	—Unverified
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation	Jun 12, 2024	Image GenerationText to Image Generation	—Unverified
FontTransformer: Few-shot High-resolution Chinese Glyph Image Synthesis via Stacked Transformers	Oct 12, 2022	Few-Shot LearningFont Generation	—Unverified
FoodFusion: A Latent Diffusion Model for Realistic Food Image Generation	Dec 6, 2023	DiversityImage Generation	—Unverified
Foodfusion: A Novel Approach for Food Image Composition via Diffusion Models	Aug 26, 2024	DenoisingImage Generation	—Unverified
TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering	Nov 28, 2023	DiversityImage Generation	—Unverified
FoolSDEdit: Deceptively Steering Your Edits Towards Targeted Attribute-aware Distribution	Feb 6, 2024	Adversarial AttackAttribute	—Unverified
TextDiffuser-RL: Efficient and Robust Text Layout Optimization for High-Fidelity Text-to-Image Synthesis	May 25, 2025	CPUGPU	—Unverified
Foreground Focus: Enhancing Coherence and Fidelity in Camouflaged Image Generation	Apr 2, 2025	DenoisingImage Generation	—Unverified
Editing 3D Scenes via Text Prompts without Retraining	Sep 10, 2023	3D scene Editing3D Scene Reconstruction	—Unverified
A Comprehensive Survey on Synthetic Infrared Image synthesis	Aug 13, 2024	Image GenerationSurvey	—Unverified
Text-driven Visual Synthesis with Latent Diffusion Prior	Feb 16, 2023	DecoderImage Generation	—Unverified
Text Embedding is Not All You Need: Attention Control for Text-to-Image Semantic Alignment with Text Self-Attention Maps	Nov 21, 2024	AllAttribute	—Unverified
Foundation Cures Personalization: Recovering Facial Personalized Models' Prompt Consistency	Nov 22, 2024	DenoisingImage Generation	—Unverified
Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions	Sep 7, 2022	Image GenerationText to Image Generation	—Unverified
FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation	Dec 3, 2024	Image Generation	—Unverified
Fourier-CPPNs for Image Synthesis	Sep 20, 2019	Image Generation	—Unverified
Text-guided Controllable Mesh Refinement for Interactive 3D Modeling	Jun 3, 2024	Image Generation	—Unverified
FRAbench and GenEval: Scaling Fine-Grained Aspect Evaluation across Tasks, Modalities	May 19, 2025	Image GenerationText Generation	—Unverified
Behavior Optimized Image Generation	Nov 18, 2023	Image GenerationMarketing	—Unverified
FrameBreak: Dramatic Image Extrapolation by Guided Shift-Maps	Jun 1, 2013	Image Generation	—Unverified
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models	Mar 28, 2024	Image GenerationVideo Generation	—Unverified

Show:10 25 50

← PrevPage 240 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified