Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 6689 papers

Title	Date	Tasks	Status	Hype
GANs Can Play Lottery Tickets Too	May 31, 2021	Image GenerationImage-to-Image Translation	CodeCode Available	1
GANs in computer vision ebook	Jun 10, 2020	ArticlesConditional Image Generation	CodeCode Available	1
Generated Faces in the Wild: Quantitative Comparison of Stable Diffusion, Midjourney and DALL-E 2	Oct 2, 2022	Image Generation	CodeCode Available	1
GANalyzer: Analysis and Manipulation of GANs Latent Space for Controllable Face Synthesis	Feb 2, 2023	AttributeFace Generation	CodeCode Available	1
GAN-based Matrix Factorization for Recommender Systems	Jan 20, 2022	Collaborative FilteringImage Generation	CodeCode Available	1
ConsistNet: Enforcing 3D Consistency for Multi-view Images Diffusion	Oct 16, 2023	Depth EstimationDepth Prediction	CodeCode Available	1
Rethinking FID: Towards a Better Evaluation Metric for Image Generation	Nov 30, 2023	Image Generation	CodeCode Available	1
Rethinking Image Deraining via Rain Streaks and Vapors	Aug 3, 2020	Image GenerationImage Restoration	CodeCode Available	1
DIVA: A Dirichlet Process Mixtures Based Incremental Deep Clustering Algorithm via Variational Auto-Encoder	May 23, 2023	ClusteringDeep Clustering	CodeCode Available	1
FunkNN: Neural Interpolation for Functional Generation	Dec 20, 2022	Image Generation	CodeCode Available	1
FuseDream: Training-Free Text-to-Image Generation with Improved CLIP+GAN Space Optimization	Dec 2, 2021	counterfactualImage Generation	CodeCode Available	1
Revealing Vulnerabilities in Stable Diffusion via Targeted Attacks	Jan 16, 2024	Adversarial AttackImage Generation	CodeCode Available	1
Causal Diffusion Autoencoders: Toward Counterfactual Generation via Diffusion Probabilistic Models	Apr 27, 2024	counterfactualDisentanglement	CodeCode Available	1
Discovering Interpretable Directions in the Semantic Latent Space of Diffusion Models	Mar 20, 2023	AttributeDenoising	CodeCode Available	1
AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal Generation	Sep 7, 2022	Image Generation	CodeCode Available	1
Discovering Transferable Forensic Features for CNN-generated Images Detection	Aug 24, 2022	Image ForensicsImage Generation	CodeCode Available	1
Fundamental Benefit of Alternating Updates in Minimax Optimization	Feb 16, 2024	Image Generation	CodeCode Available	1
Discrete Contrastive Diffusion for Cross-Modal Music and Image Generation	Jun 15, 2022	Contrastive LearningDenoising	CodeCode Available	1
Robot Synesthesia: A Sound and Emotion Guided AI Painter	Feb 9, 2023	Image GenerationImage Manipulation	CodeCode Available	1
Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images	Apr 19, 2024	Image Generation	CodeCode Available	1
Fuzzy-Conditioned Diffusion and Diffusion Projection Attention Applied to Facial Image Correction	Jun 26, 2023	Image Generation	CodeCode Available	1
S2IGAN: Speech-to-Image Generation via Adversarial Learning	May 14, 2020	Image Generation	CodeCode Available	1
GAN-Control: Explicitly Controllable GANs	Jan 7, 2021	Contrastive LearningDisentanglement	CodeCode Available	1
Discffusion: Discriminative Diffusion Models as Few-shot Vision and Language Learners	May 18, 2023	Image GenerationImage-text matching	CodeCode Available	1
Fully automatic computer-aided mass detection and segmentation via pseudo-color mammograms and Mask R-CNN	Jun 28, 2019	Image GenerationSegmentation	CodeCode Available	1
Learning to Generate Levels From Nothing	Feb 12, 2020	Image GenerationInductive Learning	CodeCode Available	1
AI-Generated Image Detection using a Cross-Attention Enhanced Dual-Stream Network	Jun 12, 2023	Image GenerationText to Image Generation	CodeCode Available	1
CoCosNet v2: Full-Resolution Correspondence Learning for Image Translation	Dec 3, 2020	Image GenerationImage-to-Image Translation	CodeCode Available	1
Fully Spiking Denoising Diffusion Implicit Models	Dec 4, 2023	DenoisingImage Generation	CodeCode Available	1
Consistency Models as a Rich and Efficient Policy Class for Reinforcement Learning	Sep 29, 2023	Image GenerationOffline RL	CodeCode Available	1
AIGCIQA2023: A Large-scale Image Quality Assessment Database for AI Generated Images: from the Perspectives of Quality, Authenticity and Correspondence	Jul 1, 2023	Image GenerationImage Quality Assessment	CodeCode Available	1
DivCo: Diverse Conditional Image Synthesis via Contrastive Generative Adversarial Network	Mar 14, 2021	Contrastive LearningDiversity	CodeCode Available	1
Fully Spiking Variational Autoencoder	Sep 26, 2021	Image GenerationTime Series	CodeCode Available	1
GAN Path Finder: Preliminary results	Aug 5, 2019	Heuristic SearchImage Generation	CodeCode Available	1
Generate Your Own Scotland: Satellite Image Generation Conditioned on Maps	Aug 31, 2023	Earth ObservationImage Generation	CodeCode Available	1
From Face to Natural Image: Learning Real Degradation for Blind Image Super-Resolution	Oct 3, 2022	Image GenerationImage Super-Resolution	CodeCode Available	1
Frido: Feature Pyramid Diffusion for Complex Scene Image Synthesis	Aug 29, 2022	Conditional Image GenerationDenoising	CodeCode Available	1
From Image to Imuge: Immunized Image Generation	Oct 27, 2021	DecoderImage Cropping	CodeCode Available	1
SCAM! Transferring humans between images with Semantic Cross Attention Modulation	Oct 10, 2022	DiversityImage Generation	CodeCode Available	1
Scatterbrain: Unifying Sparse and Low-rank Attention Approximation	Oct 28, 2021	Image GenerationLanguage Modeling	CodeCode Available	1
Freeze the Discriminator: a Simple Baseline for Fine-Tuning GANs	Feb 25, 2020	10-shot image generationImage Generation	CodeCode Available	1
DiTAS: Quantizing Diffusion Transformers via Enhanced Activation Smoothing	Sep 12, 2024	Image GenerationQuantization	CodeCode Available	1
Frequency Domain Image Translation: More Photo-realistic, Better Identity-preserving	Nov 27, 2020	Image GenerationImage-to-Image Translation	CodeCode Available	1
Towards Disentangling Latent Space for Unsupervised Semantic Face Editing	Nov 5, 2020	AttributeImage Generation	CodeCode Available	1
Connect, Collapse, Corrupt: Learning Cross-Modal Tasks with Uni-Modal Data	Jan 16, 2024	Image GenerationText to Image Generation	CodeCode Available	1
Score-Based Generative Modeling through Stochastic Differential Equations	Nov 26, 2020	ColorizationDensity Estimation	CodeCode Available	1
Adversarial Illusions in Multi-Modal Embeddings	Aug 22, 2023	Image GenerationText Generation	CodeCode Available	1
FreeGraftor: Training-Free Cross-Image Feature Grafting for Subject-Driven Text-to-Image Generation	Apr 22, 2025	Image GenerationText to Image Generation	CodeCode Available	1
FreCaS: Efficient Higher-Resolution Image Generation via Frequency-aware Cascaded Sampling	Oct 24, 2024	Image Generation	CodeCode Available	1
CONFIG: Controllable Neural Face Image Generation	May 6, 2020	AttributeFace Model	CodeCode Available	1

Show:10 25 50

← PrevPage 36 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified