Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3851–3900 of 6689 papers

Title	Date	Tasks	Status
One Model to Synthesize Them All: Multi-contrast Multi-scale Transformer for Missing Data Imputation	Apr 28, 2022	AllDecoder	—Unverified
An Improved Composite Functional Gradient Learning by Wasserstein Regularization for Generative adversarial networks	Sep 29, 2021	Image Generationregression	—Unverified
Understanding Attention for Vision-and-Language Tasks	Dec 17, 2021	Image GenerationImage Retrieval	—Unverified
One-Shot Generalization in Deep Generative Models	Mar 16, 2016	BIG-bench Machine LearningDensity Estimation	—Unverified
Understanding Diffusion Models: A Unified Perspective	Aug 25, 2022	3D Absolute Human Pose EstimationImage Generation	—Unverified
Understanding Diffusion Models by Feynman's Path Integral	Mar 17, 2024	Image Generation	—Unverified
One-step Diffusion Models with f-Divergence Distribution Matching	Feb 21, 2025	Image GenerationText to Image Generation	—Unverified
An Impartial Transformer for Story Visualization	Jan 9, 2023	Image GenerationStory Visualization	—Unverified
3D MedDiffusion: A 3D Medical Diffusion Model for Controllable and High-quality Medical Image Generation	Dec 17, 2024	CT ReconstructionData Augmentation	—Unverified
One-Way Ticket: Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models	Jan 1, 2025	Computational EfficiencyDiversity	—Unverified
On Fairness of Unified Multimodal Large Language Model for Image Generation	Feb 5, 2025	FairnessImage Generation	—Unverified
Understanding Pose and Appearance Disentanglement in 3D Human Pose Estimation	Sep 20, 2023	3D Human Pose EstimationAdversarial Attack	—Unverified
On Geometrical Properties of Text Token Embeddings for Strong Semantic Binding in Text-to-Image Generation	Mar 29, 2025	Image GenerationText to Image Generation	—Unverified
On Improved Conditioning Mechanisms and Pre-training Strategies for Diffusion Models	Nov 5, 2024	Image GenerationText to Image Generation	—Unverified
Understanding Subjectivity through the Lens of Motivational Context in Model-Generated Image Satisfaction	Feb 27, 2024	Image Generation	—Unverified
Only-Style: Stylistic Consistency in Image Generation without Content Leakage	Jun 11, 2025	Image Generation	—Unverified
Understanding the Limitations of Diffusion Concept Algebra Through Food	Jun 5, 2024	DiversityImage Generation	—Unverified
Anime Style Space Exploration Using Metric Learning and Generative Adversarial Networks	May 21, 2018	Generative Adversarial NetworkImage Generation	—Unverified
On Suppressing Range of Adaptive Stepsizes of Adam to Improve Generalisation Performance	Feb 2, 2023	image-classificationImage Classification	—Unverified
On Synthetic Texture Datasets: Challenges, Creation, and Curation	Sep 16, 2024	Image GenerationTexture Synthesis	—Unverified
On the Adversarial Robustness of Generative Autoencoders in the Latent Space	Jul 5, 2023	Adversarial Robustnesscompressed sensing	—Unverified
On the Design of Diffusion-based Neural Speech Codecs	Apr 11, 2025	Audio GenerationImage Generation	—Unverified
On The Distribution of Penultimate Activations of Classification Networks	Jul 5, 2021	ClassificationConditional Image Generation	—Unverified
Understanding Transferable Representation Learning and Zero-shot Transfer in CLIP	Oct 2, 2023	Image GenerationRepresentation Learning	—Unverified
AniMer: Animal Pose and Shape Estimation Using Family Aware Transformer	Dec 1, 2024	Conditional Image GenerationContrastive Learning	—Unverified
On the Relation Between Linear Diffusion and Power Iteration	Oct 16, 2024	DenoisingImage Generation	—Unverified
Understanding (Un)Intended Memorization in Text-to-Image Generative Models	Dec 6, 2023	Image GenerationMemorization	—Unverified
On the Role of Receptive Field in Unsupervised Sim-to-Real Image Translation	Jan 25, 2020	DiversityImage Generation	—Unverified
On the Scalability of Diffusion-based Text-to-Image Generation	Apr 3, 2024	DenoisingDiversity	—Unverified
On the Scalability of GNNs for Molecular Graphs	Apr 17, 2024	DiversityDrug Discovery	—Unverified
On the Semantic Latent Space of Diffusion-Based Text-to-Speech Models	Feb 19, 2024	DenoisingImage Generation	—Unverified
On the Sins of Image Synthesis Loss for Self-supervised Depth Estimation	Sep 13, 2021	AttributeDepth Estimation	—Unverified
On the Solution of Linearized Inverse Scattering Problems in Near-Field Microwave Imaging by Operator Inversion and Matched Filtering	Oct 9, 2024	Image Generation	—Unverified
On the Study of Sample Complexity for Polynomial Neural Networks	Jul 18, 2022	Face RecognitionImage Generation	—Unverified
AnimeDL-2M: Million-Scale AI-Generated Anime Image Detection and Localization in Diffusion Era	Apr 15, 2025	Image GenerationImage Manipulation	—Unverified
On Using Backpropagation for Speech Texture Generation and Voice Conversion	Dec 22, 2017	Image Generationspeech-recognition	—Unverified
An Image-like Diffusion Method for Human-Object Interaction Detection	Mar 23, 2025	Human-Object Interaction DetectionImage Generation	—Unverified
OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting	Jul 15, 2024	Image GenerationMamba	—Unverified
Open Domain Dialogue Generation with Latent Images	Apr 4, 2020	Dialogue GenerationImage Generation	—Unverified
Opening the Black Box: Hierarchical Sampling Optimization for Estimating Human Hand Pose	Dec 1, 2015	Hand Pose EstimationImage Generation	—Unverified
An Image is Worth Multiple Words: Multi-attribute Inversion for Constrained Text-to-Image Synthesis	Nov 20, 2023	AttributeDenoising	—Unverified
Open Set Learning with Counterfactual Images	Sep 1, 2018	Classificationcounterfactual	—Unverified
Open Set Synthetic Image Source Attribution	Aug 22, 2023	AttributeImage Generation	—Unverified
An Image is Worth More Than 16x16 Patches: Exploring Transformers on Individual Pixels	Jun 13, 2024	Image GenerationInductive Bias	—Unverified
AniFaceDrawing: Anime Portrait Exploration during Your Sketching	Jun 13, 2023	Conditional Image GenerationDisentanglement	—Unverified
Operator-learning-inspired Modeling of Neural Ordinary Differential Equations	Dec 16, 2023	image-classificationImage Classification	—Unverified
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance	May 23, 2024	Face GenerationImage Generation	—Unverified
OP-LoRA: The Blessing of Dimensionality	Dec 13, 2024	Image Generation	—Unverified
OptGAN: Optimizing and Interpreting the Latent Space of the Conditional Text-to-Image GANs	Feb 25, 2022	Data AugmentationImage Generation	—Unverified
Optical Diffusion Models for Image Generation	Jul 15, 2024	DenoisingImage Generation	—Unverified

Show:10 25 50

← PrevPage 78 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified