Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4026–4050 of 6689 papers

Title	Date	Tasks	Status
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation	Mar 8, 2024	ArticlesHallucination	—Unverified
DiffChat: Learning to Chat with Text-to-Image Synthesis Models for Interactive Image Creation	Mar 8, 2024	Image GenerationInstruction Following	—Unverified
A Data Augmentation Pipeline to Generate Synthetic Labeled Datasets of 3D Echocardiography Images using a GAN	Mar 8, 2024	Computed Tomography (CT)Data Augmentation	—Unverified
Synthetic Privileged Information Enhances Medical Image Representation Learning	Mar 8, 2024	Image GenerationMedical Image Analysis	—Unverified
Beyond Finite Data: Towards Data-free Out-of-distribution Generalization via Extrapolation	Mar 8, 2024	Domain GeneralizationImage Generation	—Unverified
Improving Diffusion-Based Generative Models via Approximated Optimal Transport	Mar 8, 2024	Image Generation	CodeCode Available
Towards Effective Usage of Human-Centric Priors in Diffusion Models for Text-based Human Image Generation	Mar 8, 2024	Image Generation	—Unverified
A spatiotemporal style transfer algorithm for dynamic visual stimulus generation	Mar 7, 2024	Image GenerationObject Recognition	—Unverified
Discriminative Probing and Tuning for Text-to-Image Generation	Mar 7, 2024	Image GenerationText to Image Generation	—Unverified
Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer	Mar 6, 2024	Image Generation	—Unverified
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport	Mar 6, 2024	Image Generation	—Unverified
Investigation of the Impact of Synthetic Training Data in the Industrial Application of Terminal Strip Object Detection	Mar 6, 2024	Image Generationobject-detection	—Unverified
Measuring Diversity in Co-creative Image Generation	Mar 6, 2024	DiversityImage Generation	—Unverified
Towards Understanding Cross and Self-Attention in Stable Diffusion for Text-Guided Image Editing	Mar 6, 2024	DenoisingImage Generation	—Unverified
(Un)paired signal-to-signal translation with 1D conditional GANs	Mar 5, 2024	Audio GenerationGenerative Adversarial Network	—Unverified
HanDiffuser: Text-to-Image Generation With Realistic Hand Appearances	Mar 4, 2024	Image GenerationText to Image Generation	—Unverified
AtomoVideo: High Fidelity Image-to-Video Generation	Mar 4, 2024	Image GenerationImage to Video Generation	—Unverified
NiNformer: A Network in Network Transformer with Token Mixing Generated Gating Function	Mar 4, 2024	image-classificationImage Classification	CodeCode Available
Transformer for Times Series: an Application to the S&P500	Mar 4, 2024	Image GenerationTime Series	—Unverified
SCott: Accelerating Diffusion Models with Stochastic Consistency Distillation	Mar 3, 2024	Image GenerationText to Image Generation	—Unverified
Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian Mixture Models	Mar 3, 2024	DiversityImage Generation	—Unverified
Critical windows: non-asymptotic theory for feature emergence in diffusion models	Mar 3, 2024	FairnessImage Generation	—Unverified
Bespoke Non-Stationary Solvers for Fast Sampling of Diffusion and Flow Models	Mar 2, 2024	Audio GenerationConditional Image Generation	—Unverified
TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion	Mar 2, 2024	Image GenerationText to Image Generation	—Unverified
An Ordinal Diffusion Model for Generating Medical Images with Different Severity Levels	Mar 1, 2024	Image GenerationMedical Image Generation	—Unverified

Show:10 25 50

← PrevPage 162 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified