Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 6689 papers

Title	Date	Tasks	Status	Hype
Adaptive Latent Diffusion Model for 3D Medical Image to Image Translation: Multi-modal Magnetic Resonance Imaging Study	Nov 1, 2023	Image GenerationImage-to-Image Translation	CodeCode Available	1
Counterfactual contrastive learning: robust representations via causal image synthesis	Mar 14, 2024	Contrastive Learningcounterfactual	CodeCode Available	1
Data Augmentation Based Malware Detection using Convolutional Neural Networks	Oct 5, 2020	Data AugmentationImage Augmentation	CodeCode Available	1
HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts	Sep 4, 2024	4kDenoising	CodeCode Available	1
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples	Feb 20, 2024	counterfactualData Augmentation	CodeCode Available	1
Automatic Jailbreaking of the Text-to-Image Generative AI Systems	May 26, 2024	Image GenerationInformation Retrieval	CodeCode Available	1
Analyzing and Improving the Image Quality of StyleGAN	Dec 3, 2019	AttributeConditional Image Generation	CodeCode Available	1
HistoSmith: Single-Stage Histology Image-Label Generation via Conditional Latent Diffusion for Enhanced Cell Segmentation and Classification	Feb 12, 2025	Cell SegmentationImage Generation	CodeCode Available	1
Frame Interpolation with Consecutive Brownian Bridge Diffusion	May 9, 2024	Conditional Image GenerationImage Generation	CodeCode Available	1
FreCaS: Efficient Higher-Resolution Image Generation via Frequency-aware Cascaded Sampling	Oct 24, 2024	Image Generation	CodeCode Available	1
Frequency Domain Image Translation: More Photo-realistic, Better Identity-preserving	Nov 27, 2020	Image GenerationImage-to-Image Translation	CodeCode Available	1
Data Extrapolation for Text-to-image Generation on Small Datasets	Oct 2, 2024	Data AugmentationImage Generation	CodeCode Available	1
Fully Spiking Variational Autoencoder	Sep 26, 2021	Image GenerationTime Series	CodeCode Available	1
Denoising Diffusion Probabilistic Model for Retinal Image Generation and Segmentation	Aug 16, 2023	DenoisingImage Generation	CodeCode Available	1
Benchmarking Counterfactual Image Generation	Mar 29, 2024	BenchmarkingConditional Image Generation	CodeCode Available	1
How to train your neural ODE: the world of Jacobian and kinetic regularization	Feb 7, 2020	Density EstimationImage Generation	CodeCode Available	1
ForkGAN: Seeing into the Rainy Night	Aug 1, 2020	Image GenerationImage Segmentation	CodeCode Available	1
Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models	Mar 30, 2023	DisentanglementImage Generation	CodeCode Available	1
Forward-only Diffusion Probabilistic Models	May 22, 2025	Conditional Image GenerationImage Dehazing	CodeCode Available	1
Deep-Masking Generative Network: A Unified Framework for Background Restoration from Superimposed Images	Oct 9, 2020	Image DehazingImage Generation	CodeCode Available	1
Forget About the LiDAR: Self-Supervised Depth Estimators with MED Probability Volumes	Aug 9, 2020	Depth EstimationImage Generation	CodeCode Available	1
Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark	Nov 23, 2024	Image GenerationText to Image Generation	CodeCode Available	1
HWD: A Novel Evaluation Score for Styled Handwritten Text Generation	Oct 31, 2023	Image GenerationPerceptual Distance	CodeCode Available	1
DC-cycleGAN: Bidirectional CT-to-MR Synthesis from Unpaired Data	Nov 2, 2022	Image GenerationSSIM	CodeCode Available	1
FooDI-ML: a large multi-language dataset of food, drinks and groceries images and descriptions	Oct 5, 2021	Conditional Image GenerationImage Generation	CodeCode Available	1
DCN-T: Dual Context Network with Transformer for Hyperspectral Image Classification	Apr 19, 2023	Hyperspectral Image Classificationimage-classification	CodeCode Available	1
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models	Apr 18, 2023	Image GenerationSuper-Resolution	CodeCode Available	1
IDF-CR: Iterative Diffusion Process for Divide-and-Conquer Cloud Removal in Remote-sensing Images	Mar 18, 2024	Cloud RemovalImage Generation	CodeCode Available	1
Correcting Diffusion Generation through Resampling	Dec 10, 2023	Image GenerationObject	CodeCode Available	1
Focal Frequency Loss for Image Reconstruction and Synthesis	Dec 23, 2020	Image GenerationImage Reconstruction	CodeCode Available	1
Illiterate DALL-E Learns to Compose	Oct 17, 2021	DecoderImage Generation	CodeCode Available	1
Foreground-Background Separation through Concept Distillation from Generative Image Foundation Models	Jan 1, 2023	Conditional Image GenerationImage Generation	CodeCode Available	1
Co-Reinforcement Learning for Unified Multimodal Understanding and Generation	May 23, 2025	Image Generationreinforcement-learning	CodeCode Available	1
Flow Contrastive Estimation of Energy-Based Models	Dec 2, 2019	Image GenerationSemi-Supervised Image Classification	CodeCode Available	1
Beyond a Video Frame Interpolator: A Space Decoupled Learning Approach to Continuous Image Transition	Mar 18, 2022	Image GenerationImage Morphing	CodeCode Available	1
Image Captions are Natural Prompts for Text-to-Image Models	Jul 17, 2023	Image CaptioningImage Generation	CodeCode Available	1
Anatomical Consistency and Adaptive Prior-informed Transformation for Multi-contrast MR Image Synthesis via Diffusion Model	Jan 1, 2025	DiagnosticImage Generation	CodeCode Available	1
Image Generation Diversity Issues and How to Tame Them	Nov 25, 2024	DiversityImage Generation	CodeCode Available	1
Beyond Fine-Tuning: A Systematic Study of Sampling Techniques in Personalized Image Generation	Feb 9, 2025	Image GenerationPersonalized Image Generation	CodeCode Available	1
SketchyCOCO: Image Generation from Freehand Scene Sketches	Mar 5, 2020	AttributeGenerative Adversarial Network	CodeCode Available	1
Deep Spatial Transformation for Pose-Guided Person Image Generation and Animation	Aug 27, 2020	Image AnimationImage Generation	CodeCode Available	1
FPGAN-Control: A Controllable Fingerprint Generator for Training with Synthetic Data	Oct 29, 2023	DisentanglementImage Generation	CodeCode Available	1
Fundamental Benefit of Alternating Updates in Minimax Optimization	Feb 16, 2024	Image Generation	CodeCode Available	1
Generative diffusion model with inverse renormalization group flows	Jan 15, 2025	Audio SynthesisDenoising	CodeCode Available	1
FLAME Diffuser: Wildfire Image Synthesis using Mask Guided Diffusion	Mar 6, 2024	Fire DetectionImage Generation	CodeCode Available	1
Fine-tuning large language models for domain adaptation: Exploration of training strategies, scaling, model merging and synergistic capabilities	Sep 5, 2024	Domain AdaptationImage Generation	CodeCode Available	1
Text-Anchored Score Composition: Tackling Condition Misalignment in Text-to-Image Diffusion Models	Jun 26, 2023	Image Generation	CodeCode Available	1
Finite Scalar Quantization: VQ-VAE Made Simple	Sep 27, 2023	ColorizationDepth Estimation	CodeCode Available	1
Aligning Text to Image in Diffusion Models is Easier Than You Think	Mar 11, 2025	Contrastive LearningImage Generation	CodeCode Available	1
CookGAN: Meal Image Synthesis from Ingredients	Feb 25, 2020	Image Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 28 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified