Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4751–4800 of 6689 papers

Title	Date	Tasks	Status
Mindstorms in Natural Language-Based Societies of Mind	May 26, 2023	3D GenerationImage Captioning	—Unverified
StyleHumanCLIP: Text-guided Garment Manipulation for StyleGAN-Human	May 26, 2023	DiversityImage Generation	—Unverified
Surrogate Modeling of Car Drag Coefficient with Depth and Normal Renderings	May 26, 2023	Image Generation	—Unverified
Stereotypes and Smut: The (Mis)representation of Non-cisgender Identities by Text-to-Image Models	May 26, 2023	Image Generation	—Unverified
Accurate generation of stochastic dynamics based on multi-model Generative Adversarial Networks	May 25, 2023	Image GenerationModel Selection	—Unverified
You Don't Have to Be Perfect to Be Amazing: Unveil the Utility of Synthetic Images	May 25, 2023	Data AugmentationImage Generation	—Unverified
ZeroAvatar: Zero-shot 3D Avatar Generation from a Single Image	May 25, 2023	3D Shape GenerationImage Generation	—Unverified
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation	May 24, 2023	Image Generation	CodeCode Available
Visual Programming for Text-to-Image Generation and Evaluation	May 24, 2023	Image GenerationLayout Generation	—Unverified
Transferring Visual Attributes from Natural Language to Verified Image Generation	May 24, 2023	Image GenerationText to Image Generation	—Unverified
Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models	May 24, 2023	GPUImage Generation	CodeCode Available
BLIP-Diffusion: Pre-trained Subject Representation for Controllable Text-to-Image Generation and Editing	May 24, 2023	Image GenerationPersonalized Image Generation	—Unverified
DuDGAN: Improving Class-Conditional GANs via Dual-Diffusion	May 24, 2023	Conditional Image GenerationImage Generation	—Unverified
SEEDS: Exponential SDE Solvers for Fast High-Quality Sampling from Diffusion Models	May 23, 2023	Image Generation	CodeCode Available
Variational Bayesian Framework for Advanced Image Generation with Domain-Related Variables	May 23, 2023	Image GenerationImage-to-Image Translation	—Unverified
Quantifying the effect of X-ray scattering for data generation in real-time defect detection	May 22, 2023	Defect DetectionImage Generation	CodeCode Available
The CLIP Model is Secretly an Image-to-Prompt Converter	May 22, 2023	Image GenerationImage-Variation	—Unverified
Design a Delicious Lunchbox in Style	May 22, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available
InstructVid2Vid: Controllable Video Editing with Natural Language Instructions	May 21, 2023	AttributeImage Generation	—Unverified
iWarpGAN: Disentangling Identity and Style to Generate Synthetic Iris Images	May 21, 2023	Image Generation	—Unverified
DiffUCD:Unsupervised Hyperspectral Image Change Detection with Semantic Correlation Diffusion Model	May 21, 2023	Change DetectionContrastive Learning	—Unverified
DiffCap: Exploring Continuous Diffusion on Image Captioning	May 20, 2023	Caption GenerationDiversity	—Unverified
Constructing Dreams using Generative AI	May 19, 2023	Image GenerationPrompt Engineering	—Unverified
Generative Sliced MMD Flows with Riesz Kernels	May 19, 2023	Image Generation	CodeCode Available
Few-shot 3D Shape Generation	May 19, 2023	3D Shape GenerationDiversity	—Unverified
ReDirTrans: Latent-to-Latent Translation for Gaze and Head Redirection	May 19, 2023	AttributeGaze Estimation	—Unverified
Efficient Cross-Lingual Transfer for Chinese Stable Diffusion with Images as Pivots	May 19, 2023	Cross-Lingual TransferImage Generation	—Unverified
SlotDiffusion: Object-Centric Generative Modeling with Diffusion Models	May 18, 2023	Image GenerationObject	—Unverified
Private Gradient Estimation is Useful for Generative Modeling	May 18, 2023	Image GenerationPrivacy Preserving	—Unverified
AIwriting: Relations Between Image Generation and Digital Writing	May 18, 2023	Image GenerationText Generation	—Unverified
RoomDreamer: Text-Driven 3D Indoor Scene Synthesis with Coherent Geometry and Texture	May 18, 2023	Image GenerationIndoor Scene Synthesis	—Unverified
Personalization as a Shortcut for Few-Shot Backdoor Attack against Text-to-Image Diffusion Models	May 18, 2023	Backdoor AttackImage Generation	—Unverified
Collaborative Generative AI: Integrating GPT-k for Efficient Editing in Text-to-Image Generation	May 18, 2023	Image GenerationText Generation	—Unverified
Fusion-S2iGan: An Efficient and Effective Single-Stage Framework for Speech-to-Image Generation	May 17, 2023	Image Generation	—Unverified
Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models	May 17, 2023	Image GenerationText-to-Video Generation	—Unverified
Generative Adversarial Networks for Brain Images Synthesis: A Review	May 16, 2023	Deep LearningGenerative Adversarial Network	—Unverified
Wavelet-based Unsupervised Label-to-Image Translation	May 16, 2023	Image GenerationImage-to-Image Translation	CodeCode Available
Towards Pragmatic Semantic Image Synthesis for Urban Scenes	May 16, 2023	Autonomous DrivingImage Generation	CodeCode Available
A Conditional Denoising Diffusion Probabilistic Model for Radio Interferometric Image Reconstruction	May 16, 2023	AstronomyDenoising	CodeCode Available
The Brain Tumor Segmentation (BraTS) Challenge 2023: Brain MR Image Synthesis for Tumor Segmentation (BraSyn)	May 15, 2023	Brain Tumor SegmentationImage Generation	—Unverified
Interactive Fashion Content Generation Using LLMs and Latent Diffusion Models	May 15, 2023	Image GenerationText to Image Generation	—Unverified
Parameter-Efficient Fine-Tuning for Medical Image Analysis: The Missed Opportunity	May 14, 2023	image-classificationImage Classification	—Unverified
Beware of diffusion models for synthesizing medical images -- A comparison with GANs in terms of memorizing brain MRI and chest x-ray images	May 12, 2023	Image GenerationText to Image Generation	—Unverified
Learning the Visualness of Text Using Large Vision-Language Models	May 11, 2023	Contrastive LearningImage Generation	—Unverified
WeditGAN: Few-Shot Image Generation via Latent Space Relocation	May 11, 2023	Image Generation	CodeCode Available
Generative Steganographic Flow	May 10, 2023	Image Generation	—Unverified
MMoT: Mixture-of-Modality-Tokens Transformer for Composed Multimodal Conditional Image Synthesis	May 10, 2023	Image Generation	—Unverified
Relightify: Relightable 3D Faces from a Single Image via Diffusion Models	May 10, 2023	DenoisingImage Generation	—Unverified
Multi-Granularity Denoising and Bidirectional Alignment for Weakly Supervised Semantic Segmentation	May 9, 2023	DenoisingImage Generation	CodeCode Available
Real-World Denoising via Diffusion Model	May 8, 2023	DenoisingImage Denoising	—Unverified

Show:10 25 50

← PrevPage 96 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified