Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5401–5450 of 6689 papers

Title	Date	Tasks	Status
Directional GAN: A Novel Conditioning Strategy for Generative Networks	May 12, 2021	Image GenerationMarketing	—Unverified
Direction-Aware Diagonal Autoregressive Image Generation	Mar 14, 2025	Image Generation	—Unverified
Disability Representations: Finding Biases in Automatic Image Generation	Jun 21, 2024	Image Generation	—Unverified
Boost Your Human Image Generation Model via Direct Preference Optimization	May 30, 2024	AnatomyImage Generation	—Unverified
Boosting Unconstrained Face Recognition with Targeted Style Adversary	Aug 14, 2024	Face RecognitionImage Generation	—Unverified
DisCoScene: Spatially Disentangled Generative Radiance Fields for Controllable 3D-aware Scene Synthesis	Dec 22, 2022	3D-Aware Image SynthesisImage Generation	—Unverified
Discovering Bugs in Vision Models using Off-the-shelf Image Generation and Captioning	Aug 18, 2022	Image GenerationImage to text	—Unverified
Discovering Class-Specific GAN Controls for Semantic Image Synthesis	Dec 2, 2022	Image Generation	—Unverified
Artificial Intelligence for Pediatric Ophthalmology	Apr 6, 2019	BIG-bench Machine LearningImage Generation	—Unverified
SVFit: Parameter-Efficient Fine-Tuning of Large Pre-Trained Models Using Singular Values	Sep 9, 2024	Domain Adaptationimage-classification	—Unverified
Discrepancy-based Diffusion Models for Lesion Detection in Brain MRI	May 8, 2024	Anomaly DetectionImage Generation	—Unverified
Discrete Modeling via Boundary Conditional Diffusion Processes	Oct 29, 2024	Image GenerationLanguage Modeling	—Unverified
Discrete Predictor-Corrector Diffusion Models for Image Synthesis	Sep 29, 2022	Conditional Image GenerationImage Generation	—Unverified
Discrete Spatial Diffusion: Intensity-Preserving Diffusion Modeling	May 3, 2025	Image GenerationImage Inpainting	—Unverified
Selftok: Discrete Visual Tokens of Autoregression, by Diffusion, and for Reasoning	May 12, 2025	Image GenerationReinforcement Learning (RL)	—Unverified
Discriminative Consistent Domain Generation for Semi-supervised Learning	Jul 24, 2019	AnatomyDomain Adaptation	—Unverified
SVS-GAN: Leveraging GANs for Semantic Video Synthesis	Sep 9, 2024	Image GenerationSemantic Segmentation	—Unverified
Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes	Jun 17, 2024	Data AugmentationImage Generation	—Unverified
Discriminative Image Generation with Diffusion Models for Zero-Shot Learning	Dec 23, 2024	Image GenerationZero-Shot Learning	—Unverified
Discriminative Probing and Tuning for Text-to-Image Generation	Mar 7, 2024	Image GenerationText to Image Generation	—Unverified
Discriminator Contrastive Divergence: Semi-Amortized Generative Modeling by Exploring Energy of the Discriminator	Oct 23, 2020	Image Generation	—Unverified
VistaDepth: Frequency Modulation With Bias Reweighting For Enhanced Long-Range Depth Estimation	Apr 21, 2025	Conditional Image GenerationDepth Estimation	—Unverified
Discriminator-Free Direct Preference Optimization for Video Diffusion	Apr 11, 2025	Image Generation	—Unverified
SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing	Apr 8, 2024	Image GenerationObject	—Unverified
Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data	Aug 28, 2024	Image Generation	—Unverified
SwapText: Image Based Texts Transfer in Scenes	Mar 18, 2020	Image GenerationTranslation	—Unverified
Disentangled Latent Energy-Based Style Translation: An Image-Level Structural MRI Harmonization Framework	Feb 10, 2024	Image GenerationTranslation	—Unverified
Disentangled Representation Learning for Controllable Person Image Generation	Dec 10, 2023	AttributeDecoder	—Unverified
Disentangled Representation Learning GAN for Pose-Invariant Face Recognition	Jul 1, 2017	DecoderFace Recognition	—Unverified
SwiftDiffusion: Efficient Diffusion Model Serving with Add-on Modules	Jul 2, 2024	Image Generation	—Unverified
Disentangling Latent Factors of Variational Auto-Encoder with Whitening	Nov 8, 2018	Image Generation	—Unverified
Disentangling Latent Hands for Image Synthesis and Pose Estimation	Dec 3, 2018	Image GenerationPose Estimation	—Unverified
Disentangling Regional Primitives for Image Generation	Oct 6, 2024	Image Generation	—Unverified
DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation	Oct 2, 2024	Image Generation	—Unverified
Swinv2-Imagen: Hierarchical Vision Transformer Diffusion Models for Text-to-Image Generation	Oct 18, 2022	Image GenerationLanguage Modelling	—Unverified
Disrupting Model Merging: A Parameter-Level Defense Without Sacrificing Accuracy	Mar 8, 2025	image-classificationImage Classification	—Unverified
SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration	Apr 30, 2024	Image Generation	—Unverified
Visual Analysis of Prediction Uncertainty in Neural Networks for Deep Image Synthesis	May 22, 2024	DiversityImage Generation	—Unverified
Distance Weighted Trans Network for Image Completion	Oct 11, 2023	Image Generation	—Unverified
Distilling Adversarial Prompts from Safety Benchmarks: Report for the Adversarial Nibbler Challenge	Sep 20, 2023	Image Generation	—Unverified
Distilling GANs with Style-Mixed Triplets for X2I Translation with Limited Data	Sep 29, 2021	Image GenerationKnowledge Distillation	—Unverified
Distilling semantically aware orders for autoregressive image generation	Apr 23, 2025	Image GenerationText Generation	—Unverified
Distilling Vision-Language Foundation Models: A Data-Free Approach via Prompt Diversification	Jul 21, 2024	Data-free Knowledge DistillationImage Generation	—Unverified
Distortion Estimation Through Explicit Modeling of the Refractive Surface	Sep 24, 2019	distortion correctionImage Generation	—Unverified
Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence	Feb 24, 2025	Image GenerationRetrieval	—Unverified
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis	Dec 2, 2024	Image GenerationText to Image Generation	—Unverified
Distribution-Conditional Generation: From Class Distribution to Creative Generation	May 6, 2025	Image Generation	—Unverified
DiT4Edit: Diffusion Transformer for Image Editing	Nov 5, 2024	Image Generation	—Unverified
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution	Mar 30, 2025	Image GenerationImage Super-Resolution	—Unverified
DiT-Air: Revisiting the Efficiency of Diffusion Model Architecture Design in Text to Image Generation	Mar 13, 2025	Image GenerationText to Image Generation	—Unverified

Show:10 25 50

← PrevPage 109 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified