Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2675 of 6689 papers

Title	Date	Tasks	Status	Hype
Behavior Generation with Latent Actions	Mar 5, 2024	Autonomous DrivingDecision Making	CodeCode Available	3
PLACE: Adaptive Layout-Semantic Fusion for Semantic Image Synthesis	Mar 4, 2024	Image Generation	CodeCode Available	1
HanDiffuser: Text-to-Image Generation With Realistic Hand Appearances	Mar 4, 2024	Image GenerationText to Image Generation	—Unverified	0
NiNformer: A Network in Network Transformer with Token Mixing Generated Gating Function	Mar 4, 2024	image-classificationImage Classification	CodeCode Available	0
OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on	Mar 4, 2024	DenoisingImage Generation	CodeCode Available	9
ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models	Mar 4, 2024	DenoisingImage Generation	CodeCode Available	3
ResAdapter: Domain Consistent Resolution Adapter for Diffusion Models	Mar 4, 2024	Image Generation	CodeCode Available	4
Transformer for Times Series: an Application to the S&P500	Mar 4, 2024	Image GenerationTime Series	—Unverified	0
AtomoVideo: High Fidelity Image-to-Video Generation	Mar 4, 2024	Image GenerationImage to Video Generation	—Unverified	0
Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian Mixture Models	Mar 3, 2024	DiversityImage Generation	—Unverified	0
SCott: Accelerating Diffusion Models with Stochastic Consistency Distillation	Mar 3, 2024	Image GenerationText to Image Generation	—Unverified	0
Critical windows: non-asymptotic theory for feature emergence in diffusion models	Mar 3, 2024	FairnessImage Generation	—Unverified	0
Bespoke Non-Stationary Solvers for Fast Sampling of Diffusion and Flow Models	Mar 2, 2024	Audio GenerationConditional Image Generation	—Unverified	0
TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion	Mar 2, 2024	Image GenerationText to Image Generation	—Unverified	0
VisionLLaMA: A Unified LLaMA Backbone for Vision Tasks	Mar 1, 2024	Image ClassificationImage Generation	CodeCode Available	3
Diff-Plugin: Revitalizing Details for Diffusion-based Low-level Tasks	Mar 1, 2024	Image Generation	—Unverified	0
An Ordinal Diffusion Model for Generating Medical Images with Different Severity Levels	Mar 1, 2024	Image GenerationMedical Image Generation	—Unverified	0
Improving Explicit Spatial Relationships in Text-to-Image Generation through an Automatically Derived Dataset	Mar 1, 2024	Image CaptioningImage Generation	CodeCode Available	0
Rethinking cluster-conditioned diffusion models for label-free image synthesis	Mar 1, 2024	ClusteringConditional Image Generation	CodeCode Available	0
Learning to Find Missing Video Frames with Synthetic Data Augmentation: A General Framework and Application in Generating Thermal Images Using RGB Cameras	Feb 29, 2024	Data AugmentationImage Generation	—Unverified	0
WDM: 3D Wavelet Diffusion Models for High-Resolution Medical Image Synthesis	Feb 29, 2024	DiversityGPU	CodeCode Available	2
ViewFusion: Towards Multi-View Consistency via Interpolated Denoising	Feb 29, 2024	DenoisingImage Generation	CodeCode Available	2
Disentangling representations of retinal images with generative models	Feb 29, 2024	DisentanglementImage Generation	CodeCode Available	0
A Quantitative Evaluation of Score Distillation Sampling Based Text-to-3D	Feb 29, 2024	Image GenerationText to 3D	—Unverified	0
A Novel Approach to Industrial Defect Generation through Blended Latent Diffusion Model with Online Adaptation	Feb 29, 2024	Anomaly DetectionDecoder	CodeCode Available	2

Show:10 25 50

← PrevPage 107 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified