Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4400 of 6689 papers

Title	Date	Tasks	Status
Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets	Nov 25, 2023	Image GenerationImage to Video Generation	CodeCode Available
Synthetic Shifts to Initial Seed Vector Exposes the Brittle Nature of Latent-Based Diffusion Models	Nov 24, 2023	Image Generation	—Unverified
AdaDiff: Adaptive Step Selection for Fast Diffusion Models	Nov 24, 2023	DenoisingImage Generation	—Unverified
CatVersion: Concatenating Embeddings for Diffusion-Based Text-to-Image Personalization	Nov 24, 2023	Image GenerationPersonalized Image Generation	—Unverified
ToddlerDiffusion: Interactive Structured Image Generation with Cascaded Schrödinger Bridge	Nov 24, 2023	DenoisingImage Generation	—Unverified
ACT-Diffusion: Efficient Adversarial Consistency Training for One-step Diffusion Models	Nov 23, 2023	DenoisingImage Generation	CodeCode Available
WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space	Nov 22, 2023	3D-Aware Image Synthesis3D geometry	—Unverified
GAN-Avatar: Controllable Personalized GAN-based Human Head Avatar	Nov 22, 2023	Image Generation	—Unverified
The Challenges of Image Generation Models in Generating Multi-Component Images	Nov 22, 2023	Image Generation	—Unverified
LucidDreamer: Domain-free Generation of 3D Gaussian Splatting Scenes	Nov 22, 2023	Image GenerationScene Generation	—Unverified
Guided Flows for Generative Modeling and Decision Making	Nov 22, 2023	Conditional Image GenerationDecision Making	—Unverified
A Somewhat Robust Image Watermark against Diffusion-based Editing Models	Nov 22, 2023	Image Generation	CodeCode Available
GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning	Nov 21, 2023	Image GenerationText-to-Video Generation	—Unverified
LoCo: Locally Constrained Training-Free Layout-to-Image Synthesis	Nov 21, 2023	Image Generation	—Unverified
Advancing Urban Renewal: An Automated Approach to Generating Historical Arcade Facades with Stable Diffusion Models	Nov 20, 2023	DiversityImage Generation	—Unverified
Nepotistically Trained Generative-AI Models Collapse	Nov 20, 2023	Image Generation	—Unverified
NeuroPrompts: An Adaptive Framework to Optimize Prompts for Text-to-Image Generation	Nov 20, 2023	Image GenerationLanguage Modeling	—Unverified
An Image is Worth Multiple Words: Multi-attribute Inversion for Constrained Text-to-Image Synthesis	Nov 20, 2023	AttributeDenoising	—Unverified
A Survey of Emerging Applications of Diffusion Probabilistic Models in MRI	Nov 19, 2023	Anomaly DetectionDiversity	—Unverified
Quality and Quantity: Unveiling a Million High-Quality Images for Text-to-Image Synthesis in Fashion Design	Nov 19, 2023	Image Generation	—Unverified
MoVideo: Motion-Aware Video Generation with Diffusion Models	Nov 19, 2023	Image GenerationImage to Video Generation	—Unverified
Mitigating Exposure Bias in Discriminator Guided Diffusion Models	Nov 18, 2023	Image Generation	—Unverified
Behavior Optimized Image Generation	Nov 18, 2023	Image GenerationMarketing	—Unverified
Wasserstein Convergence Guarantees for a General Class of Score-Based Generative Models	Nov 18, 2023	Image GenerationUnconditional Image Generation	—Unverified
Enhancing Object Coherence in Layout-to-Image Synthesis	Nov 17, 2023	Conditional Image GenerationImage Generation	CodeCode Available
End-to-end autoencoding architecture for the simultaneous generation of medical images and corresponding segmentation masks	Nov 17, 2023	Brain Tumor SegmentationData Augmentation	—Unverified
Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression	Nov 17, 2023	DiversityImage Generation	—Unverified
DIFFNAT: Improving Diffusion Image Quality Using Natural Image Statistics	Nov 16, 2023	Image GenerationImage Super-Resolution	—Unverified
Privacy Threats in Stable Diffusion Models	Nov 15, 2023	Image Generation	—Unverified
Single-Image 3D Human Digitization with Shape-Guided Diffusion	Nov 15, 2023	Image GenerationInverse Rendering	—Unverified
One-2-3-45++: Fast Single Image to 3D Objects with Consistent Multi-View Generation and 3D Diffusion	Nov 14, 2023	Image GenerationImage to 3D	—Unverified
Uni-COAL: A Unified Framework for Cross-Modality Synthesis and Super-Resolution of MR Images	Nov 14, 2023	AttributeImage Generation	CodeCode Available
Peer is Your Pillar: A Data-unbalanced Conditional GANs for Few-shot Image Generation	Nov 14, 2023	DiversityImage Generation	—Unverified
Diffusion-based generation of Histopathological Whole Slide Images at a Gigapixel scale	Nov 14, 2023	Image Generationwhole slide images	—Unverified
Finding AI-Generated Faces in the Wild	Nov 14, 2023	Image Generation	—Unverified
ChatAnything: Facetime Chat with LLM-Enhanced Personas	Nov 12, 2023	Image GenerationIn-Context Learning	—Unverified
How do Minimum-Norm Shallow Denoisers Look in Function Space?	Nov 12, 2023	Image GenerationImage Reconstruction	—Unverified
BeautifulPrompt: Towards Automatic Prompt Engineering for Text-to-Image Synthesis	Nov 12, 2023	Image GenerationPrompt Engineering	—Unverified
Retinal OCT Synthesis with Denoising Diffusion Probabilistic Models for Layer Segmentation	Nov 9, 2023	DenoisingImage Generation	—Unverified
3DGAUnet: 3D generative adversarial networks with a 3D U-Net based generator to achieve the accurate and effective synthesis of clinical tumor image data for pancreatic cancer	Nov 9, 2023	Data AugmentationImage Generation	—Unverified
L-WaveBlock: A Novel Feature Extractor Leveraging Wavelets for Generative Adversarial Networks	Nov 9, 2023	DenoisingImage Denoising	—Unverified
ConRad: Image Constrained Radiance Fields for 3D Generation from a Single Image	Nov 9, 2023	3D Generation3D Reconstruction	—Unverified
ControlStyle: Text-Driven Stylized Image Generation Using Diffusion Priors	Nov 9, 2023	Image GenerationStyle Transfer	—Unverified
SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial Network for an end-to-end image translation	Nov 7, 2023	Contrastive LearningDiversity	—Unverified
LLM as an Art Director (LaDi): Using LLMs to improve Text-to-Media Generators	Nov 7, 2023	Image GenerationRetrieval	—Unverified
Reducing Spatial Fitting Error in Distillation of Denoising Diffusion Models	Nov 7, 2023	AttributeDenoising	CodeCode Available
Image Generation and Learning Strategy for Deep Document Forgery Detection	Nov 7, 2023	Image GenerationSelf-Supervised Learning	—Unverified
Energy-Calibrated VAE with Test Time Free Lunch	Nov 7, 2023	Image GenerationImage Restoration	CodeCode Available
SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis	Nov 6, 2023	DiversityImage Generation	—Unverified
From Trojan Horses to Castle Walls: Unveiling Bilateral Data Poisoning Effects in Diffusion Models	Nov 4, 2023	Backdoor Attackbackdoor defense	CodeCode Available

Show:10 25 50

← PrevPage 88 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified