Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 6689 papers

Title	Date	Tasks	Status	Score
Adapting Diffusion Models for Improved Prompt Compliance and Controllable Image Synthesis	Oct 29, 2024	Continual LearningImage Generation	CodeCode Available	5
MC^2: Multi-concept Guidance for Customized Multi-concept Generation	Jan 1, 2025	Image GenerationText to Image Generation	CodeCode Available	5
Medical Image Synthesis with Deep Convolutional Adversarial Networks	Mar 9, 2018	Image Generation	CodeCode Available	5
CS^2: A Controllable and Simultaneous Synthesizer of Images and Annotations with Minimal Human Intervention	Jun 20, 2022	DiagnosticImage Generation	CodeCode Available	5
Axial Attention in Multidimensional Transformers	Dec 20, 2019	Image Generation	CodeCode Available	5
GAN-GA: A Generative Model based on Genetic Algorithm for Medical Image Generation	Dec 30, 2023	Data AugmentationDiversity	CodeCode Available	5
TextKD-GAN: Text Generation using KnowledgeDistillation and Generative Adversarial Networks	Apr 23, 2019	Image GenerationKnowledge Distillation	CodeCode Available	5
Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia	Mar 10, 2025	DiversityImage Generation	CodeCode Available	5
Fusion Embedding for Pose-Guided Person Image Synthesis with Diffusion Model	Dec 10, 2024	Image Generation	CodeCode Available	5
Mask Embedding in conditional GAN for Guided Synthesis of High Resolution Images	Jul 3, 2019	Image Generation	CodeCode Available	5
Functional Imaging Constrained Diffusion for Brain PET Synthesis from Structural MRI	May 3, 2024	Image Generation	CodeCode Available	5
A Multi-attribute Controllable Generative Model for Histopathology Image Synthesis	Nov 10, 2021	AttributeContrastive Learning	CodeCode Available	5
Mask and Restore: Blind Backdoor Defense at Test Time with Masked Autoencoder	Mar 27, 2023	backdoor defenseImage Generation	CodeCode Available	5
Cross-modal tumor segmentation using generative blending augmentation and self training	Apr 4, 2023	Data AugmentationImage Generation	CodeCode Available	5
fruit-SALAD: A Style Aligned Artwork Dataset to reveal similarity perception in image embeddings	Jun 3, 2024	Image Generation	CodeCode Available	5
From Trojan Horses to Castle Walls: Unveiling Bilateral Data Poisoning Effects in Diffusion Models	Nov 4, 2023	Backdoor Attackbackdoor defense	CodeCode Available	5
AdapEdit: Spatio-Temporal Guided Adaptive Editing Algorithm for Text-Based Continuity-Sensitive Image Editing	Dec 13, 2023	Image GenerationText to Image Generation	CodeCode Available	5
ManiTrans: Entity-Level Text-Guided Image Manipulation via Token-wise Semantic Alignment and Generation	Apr 9, 2022	Image GenerationImage Manipulation	CodeCode Available	5
From Text to Mask: Localizing Entities Using the Attention of Text-to-Image Diffusion Models	Sep 8, 2023	DenoisingImage Generation	CodeCode Available	5
Cross-modal RAG: Sub-dimensional Retrieval-Augmented Text-to-Image Generation	May 28, 2025	Image GenerationLanguage Modeling	CodeCode Available	5
Mapping Instructions to Actions in 3D Environments with Visual Goal Prediction	Sep 4, 2018	Action GenerationConditional Image Generation	CodeCode Available	5
MFGDiffusion: Mask-Guided Smoke Synthesis for Enhanced Forest Fire Detection	Jul 15, 2025	Fire DetectionImage Generation	CodeCode Available	5
Magic 1-For-1: Generating One Minute Video Clips within One Minute	Feb 11, 2025	Image GenerationImage to Video Generation	CodeCode Available	5
MAGIC: Mask-Guided Image Synthesis by Inverting a Quasi-Robust Classifier	Sep 23, 2022	Image Generation	CodeCode Available	5
Avatar-Net: Multi-scale Zero-shot Style Transfer by Feature Decoration	May 10, 2018	Image GenerationImage Reconstruction	CodeCode Available	5
From Keypoints to Object Landmarks via Self-Training Correspondence: A novel approach to Unsupervised Landmark Discovery	May 31, 2022	Contrastive LearningImage Generation	CodeCode Available	5
Cross-Modality Fourier Feature for Medical Image Synthesis	Jul 10, 2023	Image Generation	CodeCode Available	5
Cross-Modality Brain Tumor Segmentation via Bidirectional Global-to-Local Unsupervised Domain Adaptation	May 17, 2021	Brain Tumor SegmentationDomain Adaptation	CodeCode Available	5
A Variational U-Net for Conditional Appearance and Shape Generation	Apr 12, 2018	Conditional Image GenerationImage Generation	CodeCode Available	5
MAGAN: Margin Adaptation for Generative Adversarial Networks	Apr 12, 2017	Image Generation	CodeCode Available	5
From Easy to Hard: Building a Shortcut for Differentially Private Image Synthesis	Apr 2, 2025	Image Generation	CodeCode Available	5
Rob-GAN: Generator, Discriminator, and Adversarial Attacker	Jul 27, 2018	Adversarial AttackGenerative Adversarial Network	CodeCode Available	5
M3Dsynth: A dataset of medical 3D images with AI-generated local manipulations	Sep 14, 2023	BenchmarkingComputed Tomography (CT)	CodeCode Available	5
MACS: Multi-source Audio-to-image Generation with Contextual Significance and Semantic Alignment	Mar 13, 2025	Image Generation	CodeCode Available	5
Frequency-Supervised MR-to-CT Image Synthesis	Jul 19, 2021	Computed Tomography (CT)Image Generation	CodeCode Available	5
Learning Modality-Aware Representations: Adaptive Group-wise Interaction Network for Multimodal MRI Synthesis	Nov 22, 2024	Image GenerationImage-to-Image Translation	CodeCode Available	5
LR-GAN: Layered Recursive Generative Adversarial Networks for Image Generation	Mar 5, 2017	Image Generation	CodeCode Available	5
Loss-Sensitive Generative Adversarial Networks on Lipschitz Densities	Jan 23, 2017	Generative Adversarial Networkimage-classification	CodeCode Available	5
LumiPath -- Towards Real-time Physically-based Rendering on Embedded Devices	Mar 9, 2019	Data VisualizationImage Generation	CodeCode Available	5
Long Tail Image Generation Through Feature Space Augmentation and Iterated Learning	May 2, 2024	Image AugmentationImage Generation	CodeCode Available	5
Longitudinal Causal Image Synthesis	Oct 23, 2024	counterfactualImage Generation	CodeCode Available	5
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning	Oct 17, 2024	image-classificationImage Classification	CodeCode Available	5
Cross-Domain Adversarial Auto-Encoder	Apr 17, 2018	Domain AdaptationImage Generation	CodeCode Available	5
Autoregressive Omni-Aware Outpainting for Open-Vocabulary 360-Degree Image Generation	Sep 7, 2023	Image Generation	CodeCode Available	5
FPQVAR: Floating Point Quantization for Visual Autoregressive Model with FPGA Hardware Co-design	May 22, 2025	GPUImage Generation	CodeCode Available	5
LLM-guided Instance-level Image Manipulation with Diffusion U-Net Cross-Attention Maps	Jan 23, 2025	Image GenerationImage Manipulation	CodeCode Available	5
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers	Mar 19, 2025	Image GenerationQuantization	CodeCode Available	5
LoFT: LoRA-fused Training Dataset Generation with Few-shot Guidance	May 16, 2025	Dataset GenerationDiversity	CodeCode Available	5
Likelihood-Based Text-to-Image Evaluation with Patch-Level Perceptual and Semantic Credit Assignment	Aug 16, 2023	Image GenerationText to Image Generation	CodeCode Available	5
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks	Feb 25, 2025	Image GenerationLayout Generation	CodeCode Available	5

Show:10 25 50

← PrevPage 53 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified