Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3201–3225 of 6689 papers

Title	Date	Tasks	Status	Hype
3DStyle-Diffusion: Pursuing Fine-grained Text-driven 3D Stylization with 2D Diffusion Models	Nov 9, 2023	Image Generation	CodeCode Available	1
3DGAUnet: 3D generative adversarial networks with a 3D U-Net based generator to achieve the accurate and effective synthesis of clinical tumor image data for pancreatic cancer	Nov 9, 2023	Data AugmentationImage Generation	—Unverified	0
ControlStyle: Text-Driven Stylized Image Generation Using Diffusion Priors	Nov 9, 2023	Image GenerationStyle Transfer	—Unverified	0
ConRad: Image Constrained Radiance Fields for 3D Generation from a Single Image	Nov 9, 2023	3D Generation3D Reconstruction	—Unverified	0
LCM-LoRA: A Universal Stable-Diffusion Acceleration Module	Nov 9, 2023	GPUImage Generation	CodeCode Available	4
Retinal OCT Synthesis with Denoising Diffusion Probabilistic Models for Layer Segmentation	Nov 9, 2023	DenoisingImage Generation	—Unverified	0
L-WaveBlock: A Novel Feature Extractor Leveraging Wavelets for Generative Adversarial Networks	Nov 9, 2023	DenoisingImage Denoising	—Unverified	0
Image-Based Virtual Try-On: A Survey	Nov 8, 2023	Image GenerationSurvey	CodeCode Available	1
Image Generation and Learning Strategy for Deep Document Forgery Detection	Nov 7, 2023	Image GenerationSelf-Supervised Learning	—Unverified	0
SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial Network for an end-to-end image translation	Nov 7, 2023	Contrastive LearningDiversity	—Unverified	0
LLM as an Art Director (LaDi): Using LLMs to improve Text-to-Media Generators	Nov 7, 2023	Image GenerationRetrieval	—Unverified	0
Reducing Spatial Fitting Error in Distillation of Denoising Diffusion Models	Nov 7, 2023	AttributeDenoising	CodeCode Available	0
Energy-Calibrated VAE with Test Time Free Lunch	Nov 7, 2023	Image GenerationImage Restoration	CodeCode Available	0
AnyText: Multilingual Visual Text Generation And Editing	Nov 6, 2023	Image GenerationOptical Character Recognition (OCR)	CodeCode Available	4
SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis	Nov 6, 2023	DiversityImage Generation	—Unverified	0
From Trojan Horses to Castle Walls: Unveiling Bilateral Data Poisoning Effects in Diffusion Models	Nov 4, 2023	Backdoor Attackbackdoor defense	CodeCode Available	0
Stable Diffusion Reference Only: Image Prompt and Blueprint Jointly Guided Multi-Condition Diffusion Model for Secondary Painting	Nov 4, 2023	Image Generation	CodeCode Available	1
PRISM: Progressive Restoration for Scene Graph-based Image Manipulation	Nov 3, 2023	DenoisingDescriptive	—Unverified	0
Towards High-quality HDR Deghosting with Conditional Diffusion Models	Nov 2, 2023	DenoisingImage Generation	—Unverified	0
GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks	Nov 2, 2023	Image GenerationImage to text	—Unverified	0
Mukh-Oboyob: Stable Diffusion and BanglaBERT enhanced Bangla Text-to-Face Synthesis	Nov 1, 2023	Face GenerationImage Generation	CodeCode Available	0
LLaVA-Interactive: An All-in-One Demo for Image Chat, Segmentation, Generation and Editing	Nov 1, 2023	AllImage Generation	CodeCode Available	4
Optimal Budgeted Rejection Sampling for Generative Models	Nov 1, 2023	DiversityImage Generation	—Unverified	0
Adaptive Latent Diffusion Model for 3D Medical Image to Image Translation: Multi-modal Magnetic Resonance Imaging Study	Nov 1, 2023	Image GenerationImage-to-Image Translation	CodeCode Available	1
Flooding Regularization for Stable Training of Generative Adversarial Networks	Nov 1, 2023	Image Generation	—Unverified	0

Show:10 25 50

← PrevPage 129 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified