Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 6689 papers

Title	Date	Tasks	Status	Hype	Score
Inferring and Leveraging Parts from Object Shape for Improving Semantic Image Synthesis	May 31, 2023	Image GenerationObject	CodeCode Available	1	5
AdaNAT: Exploring Adaptive Policy for Token-Based Image Generation	Aug 31, 2024	Image GenerationScheduling	CodeCode Available	1	5
Cross Initialization for Personalized Text-to-Image Generation	Dec 26, 2023	Image GenerationText to Image Generation	CodeCode Available	1	5
AutoStory: Generating Diverse Storytelling Images with Minimal Human Effort	Nov 19, 2023	Image GenerationStory Visualization	CodeCode Available	1	5
Drop the GAN: In Defense of Patches Nearest Neighbors as Single Image Generative Models	Mar 29, 2021	Image GenerationImage Manipulation	CodeCode Available	1	5
IMPUS: Image Morphing with Perceptually-Uniform Sampling Using Diffusion Models	Nov 12, 2023	DiversityImage Generation	CodeCode Available	1	5
Cross-domain Correspondence Learning for Exemplar-based Image Translation	Apr 12, 2020	Image GenerationImage-to-Image Translation	CodeCode Available	1	5
Dressing in Order: Recurrent Person Image Generation for Pose Transfer, Virtual Try-on and Outfit Editing	Apr 14, 2021	Fashion SynthesisImage Generation	CodeCode Available	1	5
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models	Dec 3, 2024	Image GenerationPosition	CodeCode Available	1	5
Dual-Diffusion: Dual Conditional Denoising Diffusion Probabilistic Models for Blind Super-Resolution Reconstruction in RSIs	May 20, 2023	Blind Super-ResolutionDenoising	CodeCode Available	1	5
Incorporating long-range consistency in CNN-based texture generation	Jun 3, 2016	Image GenerationTexture Synthesis	CodeCode Available	1	5
InfinityGAN: Towards Infinite-Pixel Image Synthesis	Apr 8, 2021	Image GenerationScene Generation	CodeCode Available	1	5
Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation	May 30, 2025	AllBenchmarking	CodeCode Available	1	5
Cross Attention Based Style Distribution for Controllable Person Image Synthesis	Aug 1, 2022	Image GenerationPose Transfer	CodeCode Available	1	5
DRAW: A Recurrent Neural Network For Image Generation	Feb 16, 2015	FoveationImage Generation	CodeCode Available	1	5
DPM-Solver-v3: Improved Diffusion ODE Solver with Empirical Model Statistics	Oct 20, 2023	Image Generation	CodeCode Available	1	5
CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion	Jan 25, 2024	Image GenerationStyle Transfer	CodeCode Available	1	5
Improving the Speed and Quality of GAN by Adversarial Training	Aug 7, 2020	Image Generation	CodeCode Available	1	5
AutoSplice: A Text-prompt Manipulated Image Dataset for Media Forensics	Apr 14, 2023	Image and Video Forgery DetectionImage Generation	CodeCode Available	1	5
Do Neural Optimal Transport Solvers Work? A Continuous Wasserstein-2 Benchmark	Jun 3, 2021	Image Generation	CodeCode Available	1	5
DPImageBench: A Unified Benchmark for Differentially Private Image Synthesis	Mar 18, 2025	Image Generation	CodeCode Available	1	5
Improving Virtual Try-On with Garment-focused Diffusion Models	Sep 12, 2024	Image GenerationVirtual Try-on	CodeCode Available	1	5
DMM: Building a Versatile Image Generation Model via Distillation-Based Model Merging	Apr 16, 2025	Image Generationmodel	CodeCode Available	1	5
Cross-Modal Contrastive Learning for Text-to-Image Generation	Jan 12, 2021	Contrastive LearningGenerative Adversarial Network	CodeCode Available	1	5
Dual Attention GANs for Semantic Image Synthesis	Aug 29, 2020	Image GenerationPosition	CodeCode Available	1	5
Dual Contrastive Loss and Attention for GANs	Mar 31, 2021	Image GenerationUnconditional Image Generation	CodeCode Available	1	5
DocSynth: A Layout Guided Approach for Controllable Document Image Synthesis	Jul 6, 2021	Document Layout AnalysisImage Generation	CodeCode Available	1	5
DM-GAN: Dynamic Memory Generative Adversarial Networks for Text-to-Image Synthesis	Apr 2, 2019	Generative Adversarial NetworkImage Generation	CodeCode Available	1	5
Domain-Adaptive 3D Medical Image Synthesis: An Efficient Unsupervised Approach	Jul 2, 2022	Domain AdaptationImage Generation	CodeCode Available	1	5
Improving Text-to-Image Synthesis Using Contrastive Learning	Jul 6, 2021	Contrastive LearningImage Generation	CodeCode Available	1	5
Dual Pyramid Generative Adversarial Networks for Semantic Image Synthesis	Oct 8, 2022	Generative Adversarial NetworkImage Generation	CodeCode Available	1	5
Efficient-VDVAE: Less is more	Mar 25, 2022	Image GenerationQuantization	CodeCode Available	1	5
Cross-modulated Few-shot Image Generation for Colorectal Tissue Classification	Apr 4, 2023	Data Augmentationimage-classification	CodeCode Available	1	5
AMO Sampler: Enhancing Text Rendering with Overshooting	Nov 28, 2024	Image GenerationText to Image Generation	CodeCode Available	1	5
Diversity-aware Channel Pruning for StyleGAN Compression	Mar 20, 2024	DiversityImage Generation	CodeCode Available	1	5
Cross-View Image Synthesis using Conditional GANs	Mar 9, 2018	Cross-View Image-to-Image TranslationImage Generation	CodeCode Available	1	5
Diversified in-domain synthesis with efficient fine-tuning for few-shot classification	Dec 5, 2023	DiversityFew-Shot Image Classification	CodeCode Available	1	5
Harnessing LLM to Attack LLM-Guarded Text-to-Image Models	Dec 12, 2023	Image GenerationText-to-Image Generation	CodeCode Available	1	5
Improving the Fairness of Deep Generative Models without Retraining	Dec 9, 2020	AttributeDiversity	CodeCode Available	1	5
Cross-View Meets Diffusion: Aerial Image Synthesis with Geometry and Text Guidance	Aug 8, 2024	BEV SegmentationData Augmentation	CodeCode Available	1	5
Improving Visual Commonsense in Language Models via Multiple Image Generation	Jun 19, 2024	Common Sense ReasoningImage Generation	CodeCode Available	1	5
EAGAN: Efficient Two-stage Evolutionary Architecture Search for GANs	Nov 30, 2021	GPUImage Generation	CodeCode Available	1	5
Diverse Image Generation via Self-Conditioned GANs	Jun 18, 2020	ClusteringDiversity	CodeCode Available	1	5
Autoregressive Diffusion Models	Oct 5, 2021	Image Generation	CodeCode Available	1	5
Improving GANs for Long-Tailed Data through Group Spectral Regularization	Aug 21, 2022	Conditional Image GenerationImage Generation	CodeCode Available	1	5
Inversion Circle Interpolation: Diffusion-based Image Augmentation for Data-scarce Classification	Aug 29, 2024	ClassificationData Augmentation	CodeCode Available	1	5
Improving Few-shot Image Generation by Structural Discrimination and Textural Modulation	Aug 30, 2023	Image Generation	CodeCode Available	1	5
Editing in Style: Uncovering the Local Semantics of GANs	Apr 29, 2020	DisentanglementImage Generation	CodeCode Available	1	5
Improving GAN Training with Probability Ratio Clipping and Sample Reweighting	Jun 12, 2020	Image GenerationStyle Transfer	CodeCode Available	1	5
DIVA: A Dirichlet Process Mixtures Based Incremental Deep Clustering Algorithm via Variational Auto-Encoder	May 23, 2023	ClusteringDeep Clustering	CodeCode Available	1	5

Show:10 25 50

← PrevPage 26 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified