Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 6689 papers

Title	Date	Tasks	Status
Do DALL-E and Flamingo Understand Each Other?	Dec 23, 2022	Image CaptioningImage Generation	—Unverified
DOCCI: Descriptions of Connected and Contrasting Images	Apr 30, 2024	Image GenerationImage to text	—Unverified
Cheap-fake Detection with LLM using Prompt Engineering	Jun 5, 2023	Image CaptioningImage Generation	—Unverified
Are handcrafted filters helpful for attributing AI-generated images?	Jul 19, 2024	AttributeImage Attribution	—Unverified
Generative Probabilistic Image Colorization	Sep 29, 2021	ColorizationConditional Image Generation	—Unverified
Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback	Jul 10, 2023	Image GenerationVisual Question Answering (VQA)	—Unverified
ChatScratch: An AI-Augmented System Toward Autonomous Visual Programming Learning for Children Aged 6-12	Feb 7, 2024	Image Generation	—Unverified
Generative Image Modeling using Style and Structure Adversarial Networks	Mar 17, 2016	Generative Adversarial NetworkImage Generation	—Unverified
Divide and Conquer: Language Models can Plan and Self-Correct for Compositional Text-to-Image Generation	Jan 28, 2024	AttributeImage Generation	—Unverified
DIVE: Taming DINO for Subject-Driven Video Editing	Dec 4, 2024	Image GenerationVideo Editing	—Unverified
ChatPainter: Improving Text to Image Generation using Dialogue	Feb 22, 2018	Image GenerationText to Image Generation	—Unverified
Are generative models fair? A study of racial bias in dermatological image generation	Jan 20, 2025	DiversityFairness	—Unverified
Generative Model for Zero-Shot Sketch-Based Image Retrieval	Apr 18, 2019	Image GenerationImage Retrieval	—Unverified
Diversity Regularized Adversarial Learning	Jan 30, 2019	DiversityImage Generation	—Unverified
ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting	Nov 26, 2024	Image GenerationText to Image Generation	—Unverified
Diversity and Diffusion: Observations on Synthetic Image Distributions with Stable Diffusion	Oct 31, 2023	DiversityImage Generation	—Unverified
Accelerating Diffusion Models via Pre-segmentation Diffusion Sampling for Medical Image Segmentation	Oct 27, 2022	Conditional Image GenerationDenoising	—Unverified
ChatAnything: Facetime Chat with LLM-Enhanced Personas	Nov 12, 2023	Image GenerationIn-Context Learning	—Unverified
Diversify, Don't Fine-Tune: Scaling Up Visual Recognition Training with Synthetic Images	Dec 4, 2023	DiversityDomain Adaptation	—Unverified
Are Conditional Latent Diffusion Models Effective for Image Restoration?	Dec 12, 2024	Image GenerationImage Restoration	—Unverified
Diverse Single Image Generation with Controllable Global Structure	Feb 9, 2021	DiversityImage Generation	—Unverified
Adversarially robust segmentation models learn perceptually-aligned gradients	Apr 3, 2022	Image GenerationImage Inpainting	—Unverified
Generative Image Modeling Using Spatial LSTMs	Jun 10, 2015	Image GenerationTexture Synthesis	—Unverified
Character Generation through Self-Supervised Vectorization	Aug 3, 2022	Image Generation	—Unverified
Generative Flows with Invertible Attentions	Jun 7, 2021	Image Generation	—Unverified
Are conditional GANs explicitly conditional?	Jun 28, 2021	Data AugmentationDepth Estimation	—Unverified
Adversarially Perturbed Wavelet-based Morphed Face Generation	Nov 3, 2021	Face GenerationImage Generation	—Unverified
Generative Guiding Block: Synthesizing Realistic Looking Variants Capable of Even Large Change Demands	Jul 2, 2019	Image Generation	—Unverified
DiverseFlow: Sample-Efficient Diverse Mode Coverage in Flows	Apr 10, 2025	DiversityImage Generation	—Unverified
Diverse Diffusion: Enhancing Image Diversity in Text-to-Image Generation	Oct 19, 2023	DiversityImage Generation	—Unverified
A Recipe for Scaling up Text-to-Video Generation with Text-free Videos	Dec 25, 2023	Image GenerationText to Image Generation	—Unverified
PixCell: A generative foundation model for digital histopathology images	Jun 5, 2025	Cell SegmentationData Augmentation	—Unverified
Diverse and Tailored Image Generation for Zero-shot Multi-label Classification	Apr 4, 2024	Image GenerationLanguage Modelling	—Unverified
DiverGAN: An Efficient and Effective Single-Stage Framework for Diverse Text-to-Image Generation	Nov 17, 2021	DiversityImage Generation	—Unverified
DivCon: Divide and Conquer for Progressive Text-to-Image Generation	Mar 11, 2024	Image GenerationLayout-to-Image Generation	—Unverified
DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder	Jun 1, 2022	DecoderDenoising	—Unverified
Ditto: Accelerating Diffusion Model via Temporal Value Similarity	Jan 20, 2025	Image Generationmodel	—Unverified
DiTFastAttnV2: Head-wise Attention Compression for Multi-Modality Diffusion Transformers	Mar 28, 2025	2kImage Generation	—Unverified
Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step	Oct 4, 2024	Image Generation	—Unverified
FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency	Jun 10, 2025	Action GenerationImage Generation	—Unverified
Generative Modeling of Individual Behavior at Scale	Feb 20, 2025	Image GenerationMulti-Task Learning	—Unverified
DiTFastAttn: Attention Compression for Diffusion Transformer Models	Jun 12, 2024	2kImage Generation	—Unverified
Adversarially Approximated Autoencoder for Image Generation and Manipulation	Feb 14, 2019	Generative Adversarial NetworkImage Generation	—Unverified
DiT-Air: Revisiting the Efficiency of Diffusion Model Architecture Design in Text to Image Generation	Mar 13, 2025	Image GenerationText to Image Generation	—Unverified
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution	Mar 30, 2025	Image GenerationImage Super-Resolution	—Unverified
CGOF++: Controllable 3D Face Synthesis with Conditional Generative Occupancy Fields	Nov 23, 2022	Face GenerationImage Generation	—Unverified
EIUP: A Training-Free Approach to Erase Non-Compliant Concepts Conditioned on Implicit Unsafe Prompts	Aug 2, 2024	Image Generation	—Unverified
DiT4Edit: Diffusion Transformer for Image Editing	Nov 5, 2024	Image Generation	—Unverified
CG-NeRF: Conditional Generative Neural Radiance Fields	Dec 7, 2021	3D-Aware Image SynthesisDiversity	—Unverified
Adversarial Learning of Semantic Relevance in Text to Image Synthesis	Dec 12, 2018	DiversityImage Generation	—Unverified

Show:10 25 50

← PrevPage 48 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified