Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3926–3950 of 6689 papers

Title	Date	Tasks	Status
TextCraftor: Your Text Encoder Can be Image Quality Controller	Mar 27, 2024	Image Generation	—Unverified
ECNet: Effective Controllable Text-to-Image Diffusion Models	Mar 27, 2024	DenoisingImage Generation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain	Mar 26, 2024	DenoisingImage Generation	—Unverified
CT Synthesis with Conditional Diffusion Models for Abdominal Lymph Node Segmentation	Mar 26, 2024	DenoisingDiversity	—Unverified
Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases	Mar 25, 2024	Image Generation	—Unverified
SD-DiT: Unleashing the Power of Self-supervised Discrimination in Diffusion Transformer	Mar 25, 2024	DecoderImage Generation	—Unverified
Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation	Mar 25, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
Enhancing Neural Network Representations with Prior Knowledge-Based Normalization	Mar 25, 2024	ClusteringDomain Adaptation	CodeCode Available
DiffusionAct: Controllable Diffusion Autoencoder for One-shot Face Reenactment	Mar 25, 2024	Face ReenactmentImage Generation	—Unverified
An Intermediate Fusion ViT Enables Efficient Text-Image Alignment in Diffusion Models	Mar 25, 2024	Image GenerationText to Image Generation	—Unverified
Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance	Mar 25, 2024	Image Generationobject-detection	—Unverified
Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation	Mar 25, 2024	Image GenerationRelational Reasoning	CodeCode Available
Iso-Diffusion: Improving Diffusion Probabilistic Models Using the Isotropy of the Additive Gaussian Noise	Mar 25, 2024	DenoisingImage Generation	—Unverified
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation	Mar 25, 2024	Image GenerationInstruction Following	—Unverified
Multi-Scale Texture Loss for CT denoising with GANs	Mar 25, 2024	DenoisingImage Generation	CodeCode Available
R3CD: Scene Graph to Image Generation with Relation-aware Compositional Contrastive Control Diffusion	Mar 24, 2024	DenoisingImage Generation	—Unverified
Advanced Feature Manipulation for Enhanced Change Detection Leveraging Natural Language Models	Mar 23, 2024	Change DetectionImage Generation	—Unverified
Geometric Generative Models based on Morphological Equivariant PDEs and GANs	Mar 22, 2024	Image Generation	—Unverified
Generative Active Learning for Image Synthesis Personalization	Mar 22, 2024	Active LearningImage Generation	CodeCode Available
Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information	Mar 22, 2024	3D ReconstructionHallucination	—Unverified
MM-Diff: High-Fidelity Image Personalization via Multi-Modal Condition Integration	Mar 22, 2024	Image GenerationPersonalized Image Generation	—Unverified
Analysing Diffusion Segmentation for Medical Images	Mar 21, 2024	DenoisingImage Generation	—Unverified
QSMDiff: Unsupervised 3D Diffusion Models for Quantitative Susceptibility Mapping	Mar 21, 2024	DenoisingImage Denoising	—Unverified
Style-Extracting Diffusion Models for Semi-Supervised Histopathology Segmentation	Mar 21, 2024	Image GenerationSegmentation	—Unverified

Show:10 25 50

← PrevPage 158 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified