Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6300 of 6689 papers

Title	Date	Tasks	Status
Synthetic dataset generation for object-to-model deep learning in industrial applications	Sep 24, 2019	Dataset GenerationDeep Learning	CodeCode Available
Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering	May 29, 2025	DenoisingImage Generation	CodeCode Available
Neural Autoregressive Distribution Estimation	May 7, 2016	Density EstimationImage Generation	CodeCode Available
Generation of Artificial CT Images using Patch-based Conditional Generative Adversarial Networks	May 19, 2022	Computed Tomography (CT)Data Augmentation	CodeCode Available
Generation of Indian Sign Language Letters, Numbers, and Words	Oct 23, 2024	Generative Adversarial NetworkImage Generation	CodeCode Available
Lateralization MLP: A Simple Brain-inspired Architecture for Diffusion	May 25, 2024	Image GenerationText to Image Generation	CodeCode Available
Generative Active Learning for Image Synthesis Personalization	Mar 22, 2024	Active LearningImage Generation	CodeCode Available
Adversarial Synthesis Learning Enables Segmentation Without Target Modality Ground Truth	Dec 20, 2017	Image GenerationImage-to-Image Translation	CodeCode Available
LAViTeR: Learning Aligned Visual and Textual Representations Assisted by Image and Caption Generation	Sep 4, 2021	Caption GenerationImage Captioning	CodeCode Available
Neural Characteristic Function Learning for Conditional Image Generation	Jan 1, 2023	Conditional Image GenerationGenerative Adversarial Network	CodeCode Available
Prompt-Consistency Image Generation (PCIG): A Unified Framework Integrating LLMs, Knowledge Graphs, and Controllable Diffusion Models	Jun 24, 2024	HallucinationImage Generation	CodeCode Available
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration	Mar 25, 2025	Image GenerationObject	CodeCode Available
Specialist Diffusion: Plug-and-Play Sample-Efficient Fine-Tuning of Text-to-Image Diffusion Models To Learn Any Unseen Style	Jan 1, 2023	DisentanglementImage Generation	CodeCode Available
USIS: Unsupervised Semantic Image Synthesis	Sep 29, 2021	Image GenerationImage-to-Image Translation	CodeCode Available
Generative Adversarial Networks: An Overview	Oct 19, 2017	General ClassificationImage Generation	CodeCode Available
Layered Rendering Diffusion Model for Controllable Zero-Shot Image Synthesis	Nov 30, 2023	DenoisingImage Generation	CodeCode Available
TextureGAN: Controlling Deep Image Synthesis with Texture Patches	Jun 9, 2017	Image GenerationTexture Synthesis	CodeCode Available
Neural Flow Diffusion Models: Learnable Forward Process for Improved Diffusion Modelling	Apr 19, 2024	Image Generation	CodeCode Available
Contrast-augmented Diffusion Model with Fine-grained Sequence Alignment for Markup-to-Image Generation	Aug 2, 2023	cross-modal alignmentDenoising	CodeCode Available
LayerMix: Enhanced Data Augmentation through Fractal Integration for Robust Deep Learning	Jan 8, 2025	Data AugmentationImage Generation	CodeCode Available
Diffusion Sampling with Momentum for Mitigating Divergence Artifacts	Jul 20, 2023	Image GenerationText-to-Image Generation	CodeCode Available
CAM-Seg: A Continuous-valued Embedding Approach for Semantic Image Generation	Mar 19, 2025	Domain AdaptationImage Generation	CodeCode Available
Neural Photo Editing with Introspective Adversarial Networks	Sep 22, 2016	Image Generation	CodeCode Available
Generative Adversarial Networks with Decoder-Encoder Output Noise	Jul 11, 2018	DecoderImage Generation	CodeCode Available
Spectral Normalization for Generative Adversarial Networks	Feb 16, 2018	Image Generation	CodeCode Available
Neural Scene Decoration from a Single Photograph	Aug 4, 2021	Image GenerationScene Generation	CodeCode Available
Neural Style Transfer for Vector Graphics	Mar 6, 2023	Image GenerationStyle Transfer	CodeCode Available
The Role of Data Curation in Image Captioning	May 5, 2023	Few-Shot LearningImage Captioning	CodeCode Available
ASPIRE: Language-Guided Data Augmentation for Improving Robustness Against Spurious Correlations	Aug 19, 2023	ClassificationData Augmentation	CodeCode Available
Neural Voxel Renderer: Learning an Accurate and Controllable Rendering Tool	Dec 10, 2019	Image GenerationNeural Rendering	CodeCode Available
Challenges in Disentangling Independent Factors of Variation	Nov 7, 2017	Image Generation	CodeCode Available
Prompting Diffusion Representations for Cross-Domain Semantic Segmentation	Jul 5, 2023	Domain AdaptationDomain Generalization	CodeCode Available
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens	Mar 11, 2025	DecoderImage Generation	CodeCode Available
The Art of Food: Meal Image Synthesis from Ingredients	May 9, 2019	Image Generation	CodeCode Available
Disentangling representations of retinal images with generative models	Feb 29, 2024	DisentanglementImage Generation	CodeCode Available
CHAIN: Enhancing Generalization in Data-Efficient GANs via lipsCHitz continuity constrAIned Normalization	Mar 31, 2024	Image Generation	CodeCode Available
PromptMap: An Alternative Interaction Style for AI-Based Image Generation	Mar 12, 2025	Image GenerationSemantic Similarity	CodeCode Available
LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral Image Generation with Variance Regularization	Apr 29, 2023	Data AugmentationGenerative Adversarial Network	CodeCode Available
Accountable Textual-Visual Chat Learns to Reject Human Instructions in Image Re-creation	Mar 10, 2023	Image Generationmultimodal generation	CodeCode Available
Character-Centric Story Visualization via Visual Planning and Token Alignment	Oct 16, 2022	Image GenerationStory Visualization	CodeCode Available
LEAD: Min-Max Optimization from a Physical Perspective	Oct 26, 2020	Image Generation	CodeCode Available
Background Image Generation Using Boolean Operations	Oct 4, 2015	Image Generationobject-detection	CodeCode Available
ScImage: How Good Are Multimodal Large Language Models at Scientific Text-to-Image Generation?	Dec 3, 2024	AttributeImage Generation	CodeCode Available
Anti-Diffusion: Preventing Abuse of Modifications of Diffusion-Based Models	Mar 7, 2025	Image Generation	CodeCode Available
Learn, Imagine and Create: Text-to-Image Generation from Prior Knowledge	Dec 1, 2019	Image GenerationText to Image Generation	CodeCode Available
PromptPaint: Steering Text-to-Image Generation Through Paint Medium-like Interactions	Aug 9, 2023	Image GenerationText to Image Generation	CodeCode Available
Contrastive Image Synthesis and Self-supervised Feature Adaptation for Cross-Modality Biomedical Image Segmentation	Jul 27, 2022	Domain AdaptationImage Generation	CodeCode Available
Enhancing Conditional Image Generation with Explainable Latent Space Manipulation	Aug 29, 2024	Conditional Image GenerationDenoising	CodeCode Available
Scissorhands: Scrub Data Influence via Connection Sensitivity in Networks	Jan 11, 2024	image-classificationImage Classification	CodeCode Available
Backdoor Attack is a Devil in Federated GAN-based Medical Image Synthesis	Jul 2, 2022	Backdoor AttackData Poisoning	CodeCode Available

Show:10 25 50

← PrevPage 126 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified