Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5026–5050 of 6689 papers

Title	Date	Tasks	Status
CrossViewDiff: A Cross-View Diffusion Model for Satellite-to-Street View Synthesis	Aug 27, 2024	DenoisingImage Generation	—Unverified
StEP: Style-based Encoder Pre-training for Multi-modal Image Synthesis	Apr 14, 2021	Image GenerationTranslation	—Unverified
A Deep Generative Deconvolutional Image Model	Dec 23, 2015	Dictionary LearningImage Generation	—Unverified
Cross-View Image Synthesis with Deformable Convolution and Attention Mechanism	Jul 20, 2020	Image Generation	—Unverified
Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information	Mar 22, 2024	3D ReconstructionHallucination	—Unverified
StereoGen: High-quality Stereo Image Generation from a Single Image	Jan 15, 2025	Depth EstimationImage Generation	—Unverified
Efficient Visualization of Neural Networks with Generative Models and Adversarial Perturbations	Sep 20, 2024	Image Generation	—Unverified
Cartoondiff: Training-free Cartoon Image Generation with Diffusion Transformer Models	Sep 15, 2023	DenoisingImage Generation	—Unverified
Stereotypes and Smut: The (Mis)representation of Non-cisgender Identities by Text-to-Image Models	May 26, 2023	Image Generation	—Unverified
CSG: A Context-Semantic Guided Diffusion Approach in De Novo Musculoskeletal Ultrasound Image Generation	Dec 8, 2024	Image GenerationSemantic Segmentation	—Unverified
CSGO: Content-Style Composition in Text-to-Image Generation	Aug 29, 2024	Image GenerationStyle Transfer	—Unverified
CTGAN: Semantic-guided Conditional Texture Generator for 3D Shapes	Feb 8, 2024	Image GenerationTexture Synthesis	—Unverified
CT Image Synthesis Using Weakly Supervised Segmentation and Geometric Inter-Label Relations For COVID Image Analysis	Jun 15, 2021	Data AugmentationDiversity	—Unverified
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model	Apr 15, 2024	GPUImage Generation	—Unverified
CtrlNeRF: The Generative Neural Radiation Fields for the Controllable Synthesis of High-fidelity 3D-Aware Images	Dec 1, 2024	3D geometryImage Generation	—Unverified
CTRL-O: Language-Controllable Object-Centric Visual Representation Learning	Mar 27, 2025	Image GenerationObject	—Unverified
CART: Compositional Auto-Regressive Transformer for Image Generation	Nov 15, 2024	Image GenerationLanguage Modeling	—Unverified
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling	Oct 15, 2024	Conditional Image GenerationImage Generation	—Unverified
Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance	Jun 11, 2024	Appearance TransferImage Generation	—Unverified
CT Synthesis with Conditional Diffusion Models for Abdominal Lymph Node Segmentation	Mar 26, 2024	DenoisingDiversity	—Unverified
Culture-TRIP: Culturally-Aware Text-to-Image Generation with Iterative Prompt Refinement	Feb 24, 2025	Image GenerationText to Image Generation	—Unverified
Cumulant GAN	Jun 11, 2020	Image Generation	—Unverified
Current State of Community-Driven Radiological AI Deployment in Medical Imaging	Dec 29, 2022	Image GenerationMedical Image Generation	—Unverified
Cardiac ultrasound simulation for autonomous ultrasound navigation	Feb 9, 2024	DiagnosticGPU	—Unverified
A Deep Bayesian Nonparametric Framework for Robust Mutual Information Estimation	Mar 11, 2025	Image GenerationMutual Information Estimation	—Unverified

Show:10 25 50

← PrevPage 202 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified