Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4251–4300 of 6689 papers

Title	Date	Tasks	Status
DiffuseRAW: End-to-End Generative RAW Image Processing for Low-Light Images	Dec 13, 2023	Image EnhancementImage Generation	—Unverified
Image Content Generation with Causal Reasoning	Dec 12, 2023	Image GenerationQuestion Answering	CodeCode Available
DiffuVST: Narrating Fictional Scenes with Global-History-Guided Denoising Models	Dec 12, 2023	DenoisingDiversity	—Unverified
User Friendly and Adaptable Discriminative AI: Using the Lessons from the Success of LLMs and Image Generation Models	Dec 11, 2023	Image Generationobject-detection	—Unverified
Compensation Sampling for Improved Convergence in Diffusion Models	Dec 11, 2023	DenoisingFacial Inpainting	CodeCode Available
Semantic Image Synthesis for Abdominal CT	Dec 11, 2023	Data AugmentationImage Generation	—Unverified
PortraitBooth: A Versatile Portrait Model for Fast Identity-preserved Personalization	Dec 11, 2023	DiversityFace Recognition	—Unverified
Stellar: Systematic Evaluation of Human-Centric Personalized Text-to-Image Methods	Dec 11, 2023	Image GenerationText to Image Generation	—Unverified
Invariant Representation via Decoupling Style and Spurious Features from Images	Dec 11, 2023	Image GenerationRepresentation Learning	—Unverified
Class-Prototype Conditional Diffusion Model with Gradient Projection for Continual Learning	Dec 10, 2023	Continual LearningDenoising	—Unverified
Disentangled Representation Learning for Controllable Person Image Generation	Dec 10, 2023	AttributeDecoder	—Unverified
Multi-Energy Guided Image Translation with Stochastic Differential Equations for Near-Infrared Facial Expression Recognition	Dec 10, 2023	Facial Expression RecognitionFacial Expression Recognition (FER)	—Unverified
Conditional Stochastic Interpolation for Generative Learning	Dec 9, 2023	Image Generation	—Unverified
Efficient Quantization Strategies for Latent Diffusion Models	Dec 9, 2023	Image GenerationQuantization	—Unverified
MVDD: Multi-View Depth Diffusion Models	Dec 8, 2023	3D Shape GenerationDenoising	—Unverified
Synthesizing Traffic Datasets using Graph Neural Networks	Dec 8, 2023	Data AugmentationGenerative Adversarial Network	CodeCode Available
Reality's Canvas, Language's Brush: Crafting 3D Avatars from Monocular Video	Dec 8, 2023	Image GenerationNeRF	—Unverified
SmartMask: Context Aware High-Fidelity Mask Generation for Fine-grained Object Insertion and Layout Control	Dec 8, 2023	Image GenerationImage Inpainting	—Unverified
NoiseCLR: A Contrastive Learning Approach for Unsupervised Discovery of Interpretable Directions in Diffusion Models	Dec 8, 2023	Contrastive LearningImage Generation	—Unverified
Membership Inference Attacks on Diffusion Models via Quantile Regression	Dec 8, 2023	Image Generationquantile regression	—Unverified
RS-Corrector: Correcting the Racial Stereotypes in Latent Diffusion Models	Dec 8, 2023	Image Generation	—Unverified
Image Synthesis-based Late Stage Cancer Augmentation and Semi-Supervised Segmentation for MRI Rectal Cancer Staging	Dec 8, 2023	Data AugmentationImage Generation	—Unverified
KOALA: Empirical Lessons Toward Memory-Efficient and Fast Diffusion Models for Text-to-Image Synthesis	Dec 7, 2023	DenoisingImage Generation	—Unverified
Resolution Chromatography of Diffusion Models	Dec 7, 2023	DenoisingImage Generation	—Unverified
Stable Diffusion for Data Augmentation in COCO and Weed Datasets	Dec 7, 2023	Data AugmentationImage Generation	—Unverified
LSegDiff: A Latent Diffusion Model for Medical Image Segmentation	Dec 7, 2023	DecoderImage Generation	—Unverified
Gen2Det: Generate to Detect	Dec 7, 2023	Image GenerationObject	—Unverified
Generating Illustrated Instructions	Dec 7, 2023	ArticlesImage Generation	CodeCode Available
Multi-View Unsupervised Image Generation with Cross Attention Guidance	Dec 7, 2023	Hard AttentionImage Generation	—Unverified
Forensic Iris Image Synthesis	Dec 7, 2023	Image GenerationIris Recognition	CodeCode Available
DreamVideo: Composing Your Dream Videos with Customized Subject and Motion	Dec 7, 2023	Image GenerationVideo Generation	—Unverified
Approximate Caching for Efficiently Serving Diffusion Models	Dec 7, 2023	DenoisingGPU	—Unverified
Autoencoding Labeled Interpolator, Inferring Parameters From Image, And Image From Parameters	Dec 7, 2023	Image Generationparameter estimation	—Unverified
iDesigner: A High-Resolution and Complex-Prompt Following Text-to-Image Diffusion Model for Interior Design	Dec 7, 2023	Image Generation	—Unverified
FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models	Dec 6, 2023	DenoisingImage Generation	—Unverified
Memory Triggers: Unveiling Memorization in Text-To-Image Generative Models through Word-Level Duplication	Dec 6, 2023	Image GenerationMemorization	—Unverified
Cache Me if You Can: Accelerating Diffusion Models through Block Caching	Dec 6, 2023	DenoisingImage Generation	—Unverified
Context Diffusion: In-Context Aware Image Generation	Dec 6, 2023	Image GenerationIn-Context Learning	—Unverified
WarpDiffusion: Efficient Diffusion Model for High-Fidelity Virtual Try-on	Dec 6, 2023	Image GenerationVirtual Try-on	—Unverified
FoodFusion: A Latent Diffusion Model for Realistic Food Image Generation	Dec 6, 2023	DiversityImage Generation	—Unverified
Data-driven Crop Growth Simulation on Time-varying Generated Images using Multi-conditional Generative Adversarial Networks	Dec 6, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available
Understanding (Un)Intended Memorization in Text-to-Image Generative Models	Dec 6, 2023	Image GenerationMemorization	—Unverified
LooseControl: Lifting ControlNet for Generalized Depth Conditioning	Dec 5, 2023	AttributeImage Generation	—Unverified
MVHumanNet: A Large-scale Dataset of Multi-view Daily Dressing Human Captures	Dec 5, 2023	Action RecognitionImage Generation	—Unverified
Navigating the Synthetic Realm: Harnessing Diffusion-based Models for Laparoscopic Text-to-Image Generation	Dec 5, 2023	Decision MakingImage Generation	CodeCode Available
Exploring Social Bias in Downstream Applications of Text-to-Image Foundation Models	Dec 5, 2023	Image Generation	—Unverified
FERGI: Automatic Scoring of User Preferences for Text-to-Image Generation from Spontaneous Facial Expression Reaction	Dec 5, 2023	Image GenerationText to Image Generation	CodeCode Available
Diffusion-Based Speech Enhancement in Matched and Mismatched Conditions Using a Heun-Based Sampler	Dec 5, 2023	Image GenerationSpeech Enhancement	—Unverified
Learning Energy-based Model via Dual-MCMC Teaching	Dec 5, 2023	Image Generation	—Unverified
Stable Diffusion Exposed: Gender Bias from Prompt to Image	Dec 5, 2023	Image Generation	—Unverified

Show:10 25 50

← PrevPage 86 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified