Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4051–4100 of 6689 papers

Title	Date	Tasks	Status	Hype
Unsupervised Domain Transfer with Conditional Invertible Neural Networks	Mar 17, 2023	Image GenerationMedical Image Generation	—Unverified	0
GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation	Mar 17, 2023	DecoderImage Generation	CodeCode Available	1
MRIS: A Multi-modal Retrieval Approach for Image Synthesis on Diverse Modalities	Mar 17, 2023	Image GenerationImage Retrieval	—Unverified	0
Denoising Diffusion Autoencoders are Unified Self-supervised Learners	Mar 17, 2023	Contrastive LearningDenoising	CodeCode Available	1
Conditional Synthetic Food Image Generation	Mar 16, 2023	Data Augmentationimage-classification	—Unverified	0
Class Attribute Inference Attacks: Inferring Sensitive Class Information by Diffusion-Based Attribute Manipulations	Mar 16, 2023	AttributeFace Recognition	CodeCode Available	0
P+: Extended Textual Conditioning in Text-to-Image Generation	Mar 16, 2023	DenoisingImage Generation	CodeCode Available	1
SpectralCLIP: Preventing Artifacts in Text-Guided Style Transfer from a Spectral Perspective	Mar 16, 2023	Image GenerationStyle Transfer	CodeCode Available	1
Mimic3D: Thriving 3D-Aware GANs via 3D-to-2D Imitation	Mar 16, 2023	Image GenerationRepresentation Learning	—Unverified	0
Efficient Diffusion Training via Min-SNR Weighting Strategy	Mar 16, 2023	DenoisingImage Generation	CodeCode Available	1
DiffIR: Efficient Diffusion Model for Image Restoration	Mar 16, 2023	DenoisingImage Generation	CodeCode Available	2
Unified Multi-Modal Latent Diffusion for Joint Subject and Text Conditional Image Generation	Mar 16, 2023	Conditional Image GenerationImage Generation	—Unverified	0
VideoFusion: Decomposed Diffusion Models for High-Quality Video Generation	Mar 15, 2023	Code GenerationDenoising	CodeCode Available	4
MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language Knowledge	Mar 15, 2023	Action RecognitionFew-Shot action recognition	CodeCode Available	1
Multi-Exposure HDR Composition by Gated Swin Transformer	Mar 15, 2023	feature selectionImage Generation	—Unverified	0
Highly Personalized Text Embedding for Image Manipulation by Stable Diffusion	Mar 15, 2023	Image GenerationImage Manipulation	—Unverified	0
Investigating GANsformer: A Replication Study of a State-of-the-Art Image Generation Model	Mar 15, 2023	Image GenerationTransfer Learning	—Unverified	0
Unsupervised Traffic Scene Generation with Synthetic 3D Scene Graphs	Mar 15, 2023	Autonomous DrivingImage Generation	—Unverified	0
Improving 3D Imaging with Pre-Trained Perpendicular 2D Diffusion Models	Mar 15, 2023	compressed sensingImage Generation	CodeCode Available	1
Text-to-image Diffusion Models in Generative AI: A Survey	Mar 14, 2023	Image GenerationSurvey	—Unverified	0
Diffusion Models in NLP: A Survey	Mar 14, 2023	Image GenerationSurvey	—Unverified	0
Interpretable ODE-style Generative Diffusion Model via Force Field Construction	Mar 14, 2023	Image Generation	—Unverified	0
SelfPromer: Self-Prompt Dehazing Transformers with Depth-Consistency	Mar 13, 2023	Image DehazingImage Generation	CodeCode Available	1
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified	0
SDF-3DGAN: A 3D Object Generative Method Based on Implicit Signed Distance Function	Mar 13, 2023	3D-Aware Image SynthesisImage Generation	CodeCode Available	0
One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale	Mar 12, 2023	AllImage Generation	CodeCode Available	3
PARASOL: Parametric Style Control for Diffusion Image Synthesis	Mar 11, 2023	Image Generation	—Unverified	0
Regularized Vector Quantization for Tokenized Image Synthesis	Mar 11, 2023	Image GenerationQuantization	—Unverified	0
TrojDiff: Trojan Attacks on Diffusion Models with Diverse Targets	Mar 10, 2023	Image Generation	CodeCode Available	1
Self-Supervised One-Shot Learning for Automatic Segmentation of StyleGAN Images	Mar 10, 2023	Data AugmentationImage Generation	CodeCode Available	0
EHRDiff: Exploring Realistic EHR Synthesis with Diffusion Models	Mar 10, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available	1
Accountable Textual-Visual Chat Learns to Reject Human Instructions in Image Re-creation	Mar 10, 2023	Image Generationmultimodal generation	CodeCode Available	0
Learning Stationary Markov Processes with Contrastive Adjustment	Mar 9, 2023	Image GenerationImage Inpainting	CodeCode Available	0
Scaling up GANs for Text-to-Image Synthesis	Mar 9, 2023	Image GenerationText-to-Image Generation	CodeCode Available	0
Intriguing Property and Counterfactual Explanation of GAN for Remote Sensing Image Generation	Mar 9, 2023	counterfactualCounterfactual Explanation	CodeCode Available	0
3DGen: Triplane Latent Diffusion for Textured Mesh Generation	Mar 9, 2023	DiversityGPU	CodeCode Available	2
Video-P2P: Video Editing with Cross-attention Control	Mar 8, 2023	Image GenerationVideo Editing	CodeCode Available	2
Transformer-based Image Generation from Scene Graphs	Mar 8, 2023	Image GenerationImage Generation from Scene Graphs	CodeCode Available	1
M-EBM: Towards Understanding the Manifolds of Energy-Based Models	Mar 8, 2023	Image Generation	CodeCode Available	0
A Prompt Log Analysis of Text-to-Image Generation Systems	Mar 8, 2023	Image GenerationText to Image Generation	CodeCode Available	0
Video-P2P: Video Editing with Cross-attention Control	Mar 8, 2023	Image GenerationVideo Editing	CodeCode Available	2
Exploring Efficient-Tuned Learning Audio Representation Method from BriVL	Mar 8, 2023	Image GenerationRepresentation Learning	—Unverified	0
Multilevel Diffusion: Infinite Dimensional Score-Based Diffusion Models for Image Generation	Mar 8, 2023	Image Generation	CodeCode Available	1
Vector Quantized Time Series Generation with a Bidirectional Prior Model	Mar 8, 2023	Image GenerationQuantization	CodeCode Available	1
ELODIN: Naming Concepts in Embedding Spaces	Mar 7, 2023	Image Generation	—Unverified	0
Lformer: Text-to-Image Generation with L-shape Block Parallel Decoding	Mar 7, 2023	DiversityImage Generation	—Unverified	0
Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles	Mar 7, 2023	Image Generationreinforcement-learning	CodeCode Available	1
Neural Style Transfer for Vector Graphics	Mar 6, 2023	Image GenerationStyle Transfer	CodeCode Available	0
Learning multi-scale local conditional probability models of images	Mar 6, 2023	DenoisingImage Generation	CodeCode Available	1
LIDA: A Tool for Automatic Generation of Grammar-Agnostic Visualizations and Infographics using Large Language Models	Mar 6, 2023	Image GenerationStory Generation	—Unverified	0

Show:10 25 50

← PrevPage 82 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified