Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–4000 of 6689 papers

Title	Date	Tasks	Status	Hype
NeAT: Neural Artistic Tracing for Beautiful Style Transfer	Apr 11, 2023	Image GenerationStyle Transfer	CodeCode Available	1
Mask-conditioned latent diffusion for generating gastrointestinal polyp images	Apr 11, 2023	Image GenerationImage Segmentation	CodeCode Available	1
Improving Vision-and-Language Navigation by Generating Future-View Image Semantics	Apr 11, 2023	Image GenerationNavigate	—Unverified	0
HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models	Apr 11, 2023	FairnessImage Generation	CodeCode Available	1
Controllable Textual Inversion for Personalized Text-to-Image Generation	Apr 11, 2023	Active LearningImage Generation	CodeCode Available	0
Diffusion Recommender Model	Apr 11, 2023	DenoisingImage Generation	CodeCode Available	2
SAM.MD: Zero-shot medical image segmentation capabilities of the Segment Anything Model	Apr 10, 2023	Image GenerationImage Segmentation	—Unverified	0
DDRF: Denoising Diffusion Model for Remote Sensing Image Fusion	Apr 10, 2023	DenoisingImage Generation	—Unverified	0
Binary Latent Diffusion	Apr 10, 2023	Image GenerationQuantization	CodeCode Available	1
Reflected Diffusion Models	Apr 10, 2023	Image Generation	CodeCode Available	1
A Cheaper and Better Diffusion Language Model with Soft-Masked Noise	Apr 10, 2023	DenoisingImage Generation	CodeCode Available	1
Slideflow: Deep Learning for Digital Histopathology with Real-Time Whole-Slide Visualization	Apr 9, 2023	Deep LearningHistopathological Image Classification	CodeCode Available	2
HumanSD: A Native Skeleton-Guided Diffusion Model for Human Image Generation	Apr 9, 2023	DenoisingImage Generation	CodeCode Available	2
Deep Generative Modeling with Backward Stochastic Differential Equations	Apr 8, 2023	Image Generation	CodeCode Available	0
Efficient Multimodal Sampling via Tempered Distribution Flow	Apr 8, 2023	Image Generation	CodeCode Available	1
Harnessing the Spatial-Temporal Attention of Diffusion Models for High-Fidelity Text-to-Image Synthesis	Apr 7, 2023	DenoisingImage Generation	CodeCode Available	1
InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning	Apr 6, 2023	Diffusion PersonalizationDiffusion Personalization Tuning Free	—Unverified	0
Uncurated Image-Text Datasets: Shedding Light on Demographic Bias	Apr 6, 2023	Image CaptioningImage Generation	CodeCode Available	1
Zero-shot Generative Model Adaptation via Image-specific Prompt Learning	Apr 6, 2023	DiversityImage Generation	CodeCode Available	1
Few-shot Semantic Image Synthesis with Class Affinity Transfer	Apr 5, 2023	Image GenerationSemantic Segmentation	—Unverified	0
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models	Apr 5, 2023	Caption GenerationImage Generation	—Unverified	0
A Diffusion-based Method for Multi-turn Compositional Image Generation	Apr 5, 2023	DenoisingImage Generation	—Unverified	0
Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models	Apr 4, 2023	Image GenerationText to Image Generation	—Unverified	0
Cross-modulated Few-shot Image Generation for Colorectal Tissue Classification	Apr 4, 2023	Data Augmentationimage-classification	CodeCode Available	1
Cross-modal tumor segmentation using generative blending augmentation and self training	Apr 4, 2023	Data AugmentationImage Generation	CodeCode Available	0
EGC: Image Generation and Classification via a Diffusion Energy-Based Model	Apr 4, 2023	Denoisingimage-classification	CodeCode Available	1
Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation	Apr 4, 2023	Image GenerationText to Image Generation	—Unverified	0
Generative Multiplane Neural Radiance for 3D-Aware Image Generation	Apr 3, 2023	Computational EfficiencyImage Generation	CodeCode Available	1
Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free Videos	Apr 3, 2023	Image GenerationText to Image Generation	CodeCode Available	3
CG-3DSRGAN: A classification guided 3D generative adversarial network for image quality recovery from low-dose PET images	Apr 3, 2023	DiagnosticGenerative Adversarial Network	—Unverified	0
MetaHead: An Engine to Create Realistic Digital Head	Apr 3, 2023	DiversityImage Generation	—Unverified	0
ViT-DAE: Transformer-driven Diffusion Autoencoder for Histopathology Image Analysis	Apr 3, 2023	DenoisingImage Generation	—Unverified	0
Textile Pattern Generation Using Diffusion Models	Apr 2, 2023	Image Generation	—Unverified	0
Learning Dynamic Style Kernels for Artistic Style Transfer	Apr 2, 2023	Image GenerationStyle Transfer	—Unverified	0
Subject-driven Text-to-Image Generation via Apprenticeship Learning	Apr 1, 2023	Image GenerationIn-Context Learning	—Unverified	0
PrefGen: Preference Guided Image Generation with Relative Attributes	Apr 1, 2023	AttributeImage Generation	CodeCode Available	0
GlyphDraw: Seamlessly Rendering Text with Intricate Spatial Structures in Text-to-Image Generation	Mar 31, 2023	Image GenerationOptical Character Recognition (OCR)	CodeCode Available	2
GVP: Generative Volumetric Primitives	Mar 31, 2023	Image GenerationKnowledge Distillation	—Unverified	0
3D-aware Image Generation using 2D Diffusion Models	Mar 31, 2023	Image Generation	—Unverified	0
Trade-offs in Fine-tuned Diffusion Models Between Accuracy and Interpretability	Mar 31, 2023	Conditional Image GenerationImage Generation	CodeCode Available	0
Social Biases through the Text-to-Image Generation Lens	Mar 30, 2023	DescriptiveImage Generation	—Unverified	0
Masked and Adaptive Transformer for Exemplar Based Image Translation	Mar 30, 2023	Image GenerationSemantic correspondence	CodeCode Available	1
Semantic Image Translation for Repairing the Texture Defects of Building Models	Mar 30, 2023	Image GenerationStyle Transfer	—Unverified	0
Token Merging for Fast Stable Diffusion	Mar 30, 2023	Image Generation	CodeCode Available	4
LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation	Mar 30, 2023	Image GenerationLayout-to-Image Generation	CodeCode Available	2
Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models	Mar 30, 2023	DisentanglementImage Generation	CodeCode Available	1
DiffCollage: Parallel Generation of Large Content with Diffusion Models	Mar 30, 2023	Image GenerationInfinite Image Generation	—Unverified	0
KD-DLGAN: Data Limited Image Generation via Knowledge Distillation	Mar 30, 2023	DiversityImage Generation	—Unverified	0
Qualitative Failures of Image Generation Models and Their Application in Detecting Deepfakes	Mar 29, 2023	Image GenerationVideo Generation	—Unverified	0
Instant Photorealistic Neural Radiance Fields Stylization	Mar 29, 2023	GPUImage Generation	CodeCode Available	0

Show:10 25 50

← PrevPage 80 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified