Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5451–5500 of 6689 papers

Title	Date	Tasks	Status
LDFaceNet: Latent Diffusion-based Network for High-Fidelity Deepfake Generation	Aug 4, 2024	DenoisingDiversity	—Unverified
DiTFastAttn: Attention Compression for Diffusion Transformer Models	Jun 12, 2024	2kImage Generation	—Unverified
DiTFastAttnV2: Head-wise Attention Compression for Multi-Modality Diffusion Transformers	Mar 28, 2025	2kImage Generation	—Unverified
Ditto: Accelerating Diffusion Model via Temporal Value Similarity	Jan 20, 2025	Image Generationmodel	—Unverified
Symmetrical Flow Matching: Unified Image Generation, Segmentation, and Classification with Score-Based Generative Models	Jun 12, 2025	Image GenerationSegmentation	—Unverified
DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder	Jun 1, 2022	DecoderDenoising	—Unverified
Arbitrary Distributions Mapping via SyMOT-Flow: A Flow-based Approach Integrating Maximum Mean Discrepancy and Optimal Transport	Aug 26, 2023	Density EstimationDomain Adaptation	—Unverified
DivCon: Divide and Conquer for Progressive Text-to-Image Generation	Mar 11, 2024	Image GenerationLayout-to-Image Generation	—Unverified
DiverGAN: An Efficient and Effective Single-Stage Framework for Diverse Text-to-Image Generation	Nov 17, 2021	DiversityImage Generation	—Unverified
Diverse and Tailored Image Generation for Zero-shot Multi-label Classification	Apr 4, 2024	Image GenerationLanguage Modelling	—Unverified
Diverse Diffusion: Enhancing Image Diversity in Text-to-Image Generation	Oct 19, 2023	DiversityImage Generation	—Unverified
DiverseFlow: Sample-Efficient Diverse Mode Coverage in Flows	Apr 10, 2025	DiversityImage Generation	—Unverified
Visual Car Brand Classification by Implementing a Synthetic Image Dataset Creation Pipeline	Jun 3, 2024	image-classificationImage Classification	—Unverified
SyncDiffusion: Coherent Montage via Synchronized Joint Diffusions	Jun 8, 2023	Conditional Image GenerationDenoising	—Unverified
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning	Apr 10, 2025	Image GenerationIn-Context Learning	—Unverified
Diverse Single Image Generation with Controllable Global Structure	Feb 9, 2021	DiversityImage Generation	—Unverified
SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing	Jun 25, 2024	3D scene EditingImage Generation	—Unverified
Diversify, Don't Fine-Tune: Scaling Up Visual Recognition Training with Synthetic Images	Dec 4, 2023	DiversityDomain Adaptation	—Unverified
Diversity and Diffusion: Observations on Synthetic Image Distributions with Stable Diffusion	Oct 31, 2023	DiversityImage Generation	—Unverified
SynNet: Structure-Preserving Fully Convolutional Networks for Medical Image Synthesis	Jun 29, 2018	Image GenerationImage Segmentation	—Unverified
Diversity Regularized Adversarial Learning	Jan 30, 2019	DiversityImage Generation	—Unverified
DIVE: Taming DINO for Subject-Driven Video Editing	Dec 4, 2024	Image GenerationVideo Editing	—Unverified
SYNOSIS: Image synthesis pipeline for machine vision in metal surface inspection	Oct 18, 2024	Dataset GenerationDiversity	—Unverified
Divide and Conquer: Language Models can Plan and Self-Correct for Compositional Text-to-Image Generation	Jan 28, 2024	AttributeImage Generation	—Unverified
Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback	Jul 10, 2023	Image GenerationVisual Question Answering (VQA)	—Unverified
Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings	Mar 12, 2024	Image CaptioningImage Generation	—Unverified
Synthesis and Edition of Ultrasound Images via Sketch Guided Progressive Growing GANs	Apr 1, 2020	Generative Adversarial NetworkImage Generation	—Unverified
DOCCI: Descriptions of Connected and Contrasting Images	Apr 30, 2024	Image GenerationImage to text	—Unverified
Visual Concept-driven Image Generation with Text-to-Image Diffusion Model	Feb 18, 2024	Image Generation	—Unverified
Do DALL-E and Flamingo Understand Each Other?	Dec 23, 2022	Image CaptioningImage Generation	—Unverified
Do Diffusion Models Learn Semantically Meaningful and Efficient Representations?	Feb 5, 2024	Image Generation	—Unverified
On Error Propagation of Diffusion Models	Aug 9, 2023	DenoisingImage Generation	—Unverified
Do Distributed Semantic Models Dream of Electric Sheep? Visualizing Word Representations through Image Synthesis	Sep 1, 2015	Image GenerationTopic Models	—Unverified
Does CLIP perceive art the same way we do?	May 8, 2025	Image GenerationScene Understanding	—Unverified
Do I look like a `cat.n.01` to you? A Taxonomy Image Generation Benchmark	Mar 13, 2025	Common Sense ReasoningImage Generation	—Unverified
Domain Adaptation Using Adversarial Learning for Autonomous Navigation	Dec 11, 2017	Autonomous NavigationDomain Adaptation	—Unverified
Synthesis of Annotated Colorectal Cancer Tissue Images from Gland Layout	May 8, 2023	DecoderImage Generation	—Unverified
Domain-Agnostic Tuning-Encoder for Fast Personalization of Text-To-Image Models	Jul 13, 2023	Image Generation	—Unverified
Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis	Jul 15, 2024	6D Pose EstimationDiversity	—Unverified
Visual Conceptual Blending with Large-scale Language and Vision Models	Jun 27, 2021	Image GenerationLanguage Modeling	—Unverified
Do Not Mask What You Do Not Need to Mask: a Parser-Free Virtual Try-On	Jul 3, 2020	Image GenerationVirtual Try-on	—Unverified
Don't Forget your Inverse DDIM for Image Editing	May 14, 2025	Image GenerationText to Image Generation	—Unverified
DoodleFormer: Creative Sketch Drawing with Transformers	Dec 6, 2021	DecoderImage Generation	—Unverified
DOTE: Dual cOnvolutional filTer lEarning for Super-Resolution and Cross-Modality Synthesis in MRI	Jun 15, 2017	Image GenerationImage Super-Resolution	—Unverified
DPAF: Image Synthesis via Differentially Private Aggregation in Forward Phase	Apr 20, 2023	Image Generation	—Unverified
DPCL-Diff: The Temporal Knowledge Graph Reasoning Based on Graph Node Diffusion Model with Dual-Domain Periodic Contrastive Learning	Nov 3, 2024	Contrastive LearningImage Generation	—Unverified
DPDEdit: Detail-Preserved Diffusion Models for Multimodal Fashion Image Editing	Sep 2, 2024	Image GenerationLanguage Modelling	—Unverified
Synthesis of High-Quality Visible Faces from Polarimetric Thermal Faces using Generative Adversarial Networks	Dec 12, 2018	DecoderFace Generation	—Unverified
Boosting Resolution Generalization of Diffusion Transformers with Randomized Positional Encodings	Mar 24, 2025	Data AugmentationImage Cropping	—Unverified
Dr.3D: Adapting 3D GANs to Artistic Drawings	Nov 30, 2022	Image GenerationPose Estimation	—Unverified

Show:10 25 50

← PrevPage 110 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified