Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3675 of 6689 papers

Title	Date	Tasks	Status
StableMaterials: Enhancing Diversity in Material Generation via Semi-Supervised Learning	Jun 13, 2024	DiversityImage Generation	—Unverified
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation	Jun 12, 2024	Image GenerationText to Image Generation	—Unverified
What If We Recaption Billions of Web Images with LLaMA-3?	Jun 12, 2024	Cross-Modal RetrievalImage Generation	—Unverified
DiTFastAttn: Attention Compression for Diffusion Transformer Models	Jun 12, 2024	2kImage Generation	—Unverified
Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation	Jun 12, 2024	Image GenerationPerceptual Distance	—Unverified
WMAdapter: Adding WaterMark Control to Latent Diffusion Models	Jun 12, 2024	Image GenerationTransfer Learning	—Unverified
Understanding and Mitigating Compositional Issues in Text-to-Image Generative Models	Jun 12, 2024	Image Generation	CodeCode Available
Diffusion Soup: Model Merging for Text-to-Image Diffusion Models	Jun 12, 2024	Continual LearningImage Generation	—Unverified
Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance	Jun 11, 2024	Appearance TransferImage Generation	—Unverified
Beware of Aliases -- Signal Preservation is Crucial for Robust Image Restoration	Jun 11, 2024	DecoderImage Generation	—Unverified
Understanding Visual Concepts Across Models	Jun 11, 2024	Image Generationobject-detection	CodeCode Available
Progress Towards Decoding Visual Imagery via fNIRS	Jun 11, 2024	Image GenerationImage Reconstruction	—Unverified
Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense?	Jun 11, 2024	Adversarial TextImage Generation	—Unverified
Eye-for-an-eye: Appearance Transfer with Semantic Correspondence in Diffusion Models	Jun 11, 2024	Appearance TransferImage Generation	—Unverified
Instant 3D Human Avatar Generation using Image Diffusion Models	Jun 11, 2024	3D GenerationImage Generation	—Unverified
The Effect of Training Dataset Size on Discriminative and Diffusion-Based Speech Enhancement Systems	Jun 10, 2024	DiversityImage Generation	—Unverified
Can Prompt Modifiers Control Bias? A Comparative Analysis of Text-to-Image Generative Models	Jun 9, 2024	DiversityEthics	—Unverified
TIGeR: Unifying Text-to-Image Generation and Retrieval with Large Multimodal Models	Jun 9, 2024	counterfactualImage Generation	—Unverified
OmniControlNet: Dual-stage Integration for Conditional Image Generation	Jun 9, 2024	Conditional Image GenerationImage Generation	—Unverified
Regularized Training with Generated Datasets for Name-Only Transfer of Vision-Language Models	Jun 8, 2024	DiversityImage Generation	CodeCode Available
Rapid Review of Generative AI in Smart Medical Applications	Jun 8, 2024	DiagnosticImage Generation	—Unverified
GANetic Loss for Generative Adversarial Networks with a Focus on Medical Applications	Jun 7, 2024	Anomaly DetectionImage Generation	CodeCode Available
AttnDreamBooth: Towards Text-Aligned Personalized Text-to-Image Generation	Jun 7, 2024	AttributeImage Generation	—Unverified
Optimal Eye Surgeon: Finding Image Priors through Sparse Generators at Initialization	Jun 7, 2024	Image GenerationImage Restoration	CodeCode Available
PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction	Jun 7, 2024	Image GenerationImage Retrieval	CodeCode Available

Show:10 25 50

← PrevPage 147 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified