Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4750 of 6689 papers

Title	Date	Tasks	Status
Face0: Instantaneously Conditioning a Text-to-Image Model on a Face	Jun 11, 2023	Consistent Character GenerationImage Generation	—Unverified
Happy People -- Image Synthesis as Black-Box Optimization Problem in the Discrete Latent Space of Deep Generative Models	Jun 11, 2023	Drug DesignImage Generation	—Unverified
Learning Joint Latent Space EBM Prior Model for Multi-layer Generator	Jun 10, 2023	Image GenerationOutlier Detection	—Unverified
IFaceUV: Intuitive Motion Facial Image Generation by Identity Preservation via UV map	Jun 8, 2023	Image Generation	—Unverified
Unsupervised Compositional Concepts Discovery with Text-to-Image Generative Models	Jun 8, 2023	Image Generation	—Unverified
Energy-Efficient Downlink Semantic Generative Communication with Text-to-Image Generators	Jun 8, 2023	Image Generation	—Unverified
Multi-Architecture Multi-Expert Diffusion Models	Jun 8, 2023	DenoisingImage Generation	—Unverified
Grounded Text-to-Image Synthesis with Attention Refocusing	Jun 8, 2023	Image Generation	—Unverified
Gradient-Informed Quality Diversity for the Illumination of Discrete Spaces	Jun 8, 2023	DiversityDrug Discovery	—Unverified
Ownership Protection of Generative Adversarial Networks	Jun 8, 2023	Image GenerationModel extraction	—Unverified
SyncDiffusion: Coherent Montage via Synchronized Joint Diffusions	Jun 8, 2023	Conditional Image GenerationDenoising	—Unverified
GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data Generation	Jun 7, 2023	image-classificationImage Classification	—Unverified
DreamSparse: Escaping from Plato's Cave with 2D Frozen Diffusion Model Given Sparse Views	Jun 6, 2023	Image Generation	—Unverified
Discovering Novel Biological Traits From Images Using Phylogeny-Guided Neural Networks	Jun 5, 2023	Image Generation	CodeCode Available
Brain Diffusion for Visual Exploration: Cortical Discovery using Large Scale Generative Models	Jun 5, 2023	Image GenerationSpecificity	—Unverified
Composition and Deformance: Measuring Imageability with a Text-to-Image Model	Jun 5, 2023	Image CaptioningImage Generation	CodeCode Available
A Vessel-Segmentation-Based CycleGAN for Unpaired Multi-modal Retinal Image Synthesis	Jun 5, 2023	Image GenerationImage Registration	—Unverified
Semantically-Prompted Language Models Improve Visual Descriptions	Jun 5, 2023	ClassificationDescriptive	—Unverified
Cheap-fake Detection with LLM using Prompt Engineering	Jun 5, 2023	Image CaptioningImage Generation	—Unverified
Table and Image Generation for Investigating Knowledge of Entities in Pre-trained Vision and Language Models	Jun 3, 2023	ArticlesImage Generation	CodeCode Available
The Surprising Effectiveness of Diffusion Models for Optical Flow and Monocular Depth Estimation	Jun 2, 2023	DenoisingDepth Estimation	—Unverified
Unlearnable Examples for Diffusion Models: Protect Data from Unauthorized Exploitation	Jun 2, 2023	DenoisingImage Generation	—Unverified
Conditional Generation from Unconditional Diffusion Models using Denoiser Representations	Jun 2, 2023	AttributeData Augmentation	CodeCode Available
Evaluating the Capabilities of Multi-modal Reasoning Models with Synthetic Task Data	Jun 1, 2023	Anomaly DetectionImage Generation	—Unverified
Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image Generation	Jun 1, 2023	Conditional Image GenerationImage Generation	—Unverified
T2IAT: Measuring Valence and Stereotypical Biases in Text-to-Image Generation	Jun 1, 2023	Image GenerationText to Image Generation	—Unverified
UniDiff: Advancing Vision-Language Models with Generative and Discriminative Learning	Jun 1, 2023	Contrastive LearningImage Generation	—Unverified
Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance	Jun 1, 2023	Image GenerationVideo Generation	—Unverified
Discovering Failure Modes of Text-guided Diffusion Models via Adversarial Search	Jun 1, 2023	Adversarial AttackEfficient Exploration	—Unverified
Manifold Constraint Regularization for Remote Sensing Image Generation	May 31, 2023	Image Generation	—Unverified
A Unified Conditional Framework for Diffusion-based Image Restoration	May 31, 2023	DeblurringDenoising	—Unverified
AI Imagery and the Overton Window	May 31, 2023	EthicsGame Design	—Unverified
ConES: Concept Embedding Search for Parameter Efficient Tuning Large Vision Language Models	May 30, 2023	Image GenerationInstance Segmentation	—Unverified
Diffusion-Stego: Training-free Diffusion Generative Steganography via Message Projection	May 30, 2023	DenoisingImage Generation	—Unverified
Fine-Grained is Too Coarse: A Novel Data-Centric Approach for Efficient Scene Graph Generation	May 30, 2023	Graph GenerationImage Generation	CodeCode Available
Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty Quantification	May 30, 2023	DiversityImage Generation	CodeCode Available
Translation-Enhanced Multilingual Text-to-Image Generation	May 30, 2023	Cross-lingual Text-to-Image GenerationCrosslingual Text-to-Image Generation	—Unverified
Which Models have Perceptually-Aligned Gradients? An Explanation via Off-Manifold Robustness	May 30, 2023	DenoisingImage Generation	CodeCode Available
DualVAE: Controlling Colours of Generated and Real Images	May 30, 2023	Image Generation	—Unverified
Controllable Text-to-Image Generation with GPT-4	May 29, 2023	Image GenerationInstruction Following	—Unverified
Alteration-free and Model-agnostic Origin Attribution of Generated Images	May 29, 2023	Image Generation	—Unverified
Alignment-free HDR Deghosting with Semantics Consistent Transformer	May 29, 2023	Image Generation	—Unverified
BRICS: Bi-level feature Representation of Image CollectionS	May 29, 2023	DecoderImage Generation	—Unverified
Conditional Score Guidance for Text-Driven Image-to-Image Translation	May 29, 2023	Image GenerationImage-to-Image Translation	—Unverified
RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths	May 29, 2023	Image GenerationMixture-of-Experts	CodeCode Available
Mitigating Inappropriateness in Image Generation: Can there be Value in Reflecting the World's Ugliness?	May 28, 2023	Image Generation	—Unverified
Text-to-image Editing by Image Information Removal	May 27, 2023	Image GenerationImage Reconstruction	—Unverified
Im-Promptu: In-Context Composition from Image Prompts	May 26, 2023	Image GenerationMeta-Learning	CodeCode Available
Improved Visual Story Generation with Adaptive Context Modeling	May 26, 2023	Image GenerationStory Generation	—Unverified
High-Fidelity Image Compression with Score-based Generative Models	May 26, 2023	DecoderImage Compression	—Unverified

Show:10 25 50

← PrevPage 95 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified