Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6201–6250 of 6689 papers

Title	Date	Tasks	Status
Progressive and Selective Fusion Network for High Dynamic Range Imaging	Aug 19, 2021	Image GenerationVocal Bursts Intensity Prediction	CodeCode Available
End-to-end Sketch-Guided Path Planning through Imitation Learning for Autonomous Mobile Robots	Mar 21, 2025	Image GenerationImitation Learning	CodeCode Available
GD-VDM: Generated Depth for better Diffusion-based Video Generation	Jun 19, 2023	Image GenerationVideo Generation	CodeCode Available
Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models	Oct 3, 2023	Image GenerationVisual Question Answering (VQA)	CodeCode Available
Navigating the Synthetic Realm: Harnessing Diffusion-based Models for Laparoscopic Text-to-Image Generation	Dec 5, 2023	Decision MakingImage Generation	CodeCode Available
StoryDALL-E: Adapting Pretrained Text-to-Image Transformers for Story Continuation	Sep 13, 2022	Image GenerationStory Continuation	CodeCode Available
Batch-Instructed Gradient for Prompt Evolution:Systematic Prompt Optimization for Enhanced Text-to-Image Synthesis	Jun 13, 2024	Image GenerationText to Image Generation	CodeCode Available
Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator	Nov 23, 2024	Image GenerationText to Image Generation	CodeCode Available
DiffPAD: Denoising Diffusion-based Adversarial Patch Decontamination	Oct 31, 2024	Adversarial RobustnessBinarization	CodeCode Available
Towards SFW sampling for diffusion models via external conditioning	May 12, 2025	Image Generation	CodeCode Available
Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach	Nov 3, 2024	Image GenerationObject	CodeCode Available
GeneGAN: Learning Object Transfiguration and Attribute Subspace from Unpaired Data	May 14, 2017	AttributeConditional Image Generation	CodeCode Available
Adv-KD: Adversarial Knowledge Distillation for Faster Diffusion Sampling	May 31, 2024	DenoisingImage Generation	CodeCode Available
Sparse Sinkhorn Attention	Feb 26, 2020	Document ClassificationImage Generation	CodeCode Available
Towards the Automatic Anime Characters Creation with Generative Adversarial Networks	Aug 18, 2017	Generative Adversarial NetworkImage Generation	CodeCode Available
Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images	Oct 30, 2024	Image GenerationSuper-Resolution	CodeCode Available
NECOMIMI: Neural-Cognitive Multimodal EEG-informed Image Generation with Diffusion Models	Oct 1, 2024	Contrastive LearningEEG	CodeCode Available
CapsGAN: Using Dynamic Routing for Generative Adversarial Networks	Jun 7, 2018	Image GenerationRotated MNIST	CodeCode Available
UAlberta at SemEval-2023 Task 1: Context Augmentation and Translation for Multilingual Visual Word Sense Disambiguation	Jun 24, 2023	Image GenerationImage Segmentation	CodeCode Available
Adversarial Training of Variational Auto-encoders for High Fidelity Image Generation	Apr 27, 2018	Image GenerationVocal Bursts Intensity Prediction	CodeCode Available
Generate, Segment and Refine: Towards Generic Manipulation Segmentation	Nov 24, 2018	Detecting Image ManipulationImage Generation	CodeCode Available
Swin DiT: Diffusion Transformer using Pseudo Shifted Windows	May 19, 2025	Image Generation	CodeCode Available
Latent Feature and Attention Dual Erasure Attack against Multi-View Diffusion Models for 3D Assets Protection	Aug 21, 2024	3D geometryImage Generation	CodeCode Available
Latent Flow Transformer	May 20, 2025	Image Generation	CodeCode Available
Generating Annotated High-Fidelity Images Containing Multiple Coherent Objects	Jun 22, 2020	Image GenerationLayout-to-Image Generation	CodeCode Available
Scaling up GANs for Text-to-Image Synthesis	Mar 9, 2023	Image GenerationText-to-Image Generation	CodeCode Available
LatentKeypointGAN: Controlling Images via Latent Keypoints	Mar 29, 2021	Image GenerationImage Quality Assessment	CodeCode Available
DAMM-Diffusion: Learning Divergence-Aware Multi-Modal Diffusion Model for Nanoparticles Distribution Prediction	Mar 12, 2025	Image Generation	CodeCode Available
Zero-Shot Adaptation for Approximate Posterior Sampling of Diffusion Models in Inverse Problems	Jul 16, 2024	Computational EfficiencyDeblurring	CodeCode Available
When Relation Networks meet GANs: Relation GANs with Triplet Loss	Feb 24, 2020	Conditional Image GenerationImage Generation	CodeCode Available
Generating Gameplay-Relevant Art Assets with Transfer Learning	Oct 4, 2020	Image GenerationTransfer Learning	CodeCode Available
Disentangling Mean Embeddings for Better Diagnostics of Image Generators	Sep 2, 2024	Image Generation	CodeCode Available
A Distributed Generative AI Approach for Heterogeneous Multi-Domain Environments under Data Sharing constraints	Jul 17, 2025	Federated LearningImage Generation	CodeCode Available
Generating Illustrated Instructions	Dec 7, 2023	ArticlesImage Generation	CodeCode Available
ProjectedEx: Enhancing Generation in Explainable AI for Prostate Cancer	Jan 2, 2025	AttributeDiagnostic	CodeCode Available
Generating Images from Captions with Attention	Nov 9, 2015	Image GenerationRetrieval	CodeCode Available
Spatially Constrained GAN for Face and Fashion Synthesis	May 7, 2019	AttributeConditional Image Generation	CodeCode Available
Generating Images of the M87* Black Hole Using GANs	Dec 2, 2023	Data AugmentationImage Generation	CodeCode Available
Denoising and Regularization via Exploiting the Structural Bias of Convolutional Generators	Oct 31, 2019	AttributeDenoising	CodeCode Available
Viewpoint Textual Inversion: Discovering Scene Representations and 3D View Control in 2D Diffusion Models	Sep 14, 2023	Image GenerationNovel View Synthesis	CodeCode Available
Generating Images with Perceptual Similarity Metrics based on Deep Networks	Feb 8, 2016	Image Generation	CodeCode Available
3-D PET Image Generation with tumour masks using TGAN	Nov 2, 2021	Image GenerationImage Segmentation	CodeCode Available
Generating Multiple Objects at Spatially Distinct Locations	Jan 3, 2019	Conditional Image GenerationImage Generation	CodeCode Available
Latent Space Factorisation and Manipulation via Matrix Subspace Projection	Jul 26, 2019	AttributeFace Generation	CodeCode Available
Textual Aesthetics in Large Language Models	Nov 5, 2024	Image Generation	CodeCode Available
Generating Realistic Forehead-Creases for User Verification via Conditioned Piecewise Polynomial Curves	Jan 23, 2025	DiversityImage Generation	CodeCode Available
Latent Space is Feature Space: Regularization Term for GANs Training on Limited Dataset	Oct 28, 2022	Data AugmentationDiversity	CodeCode Available
Promptable Counterfactual Diffusion Model for Unified Brain Tumor Segmentation and Generation with MRIs	Jul 17, 2024	Brain Tumor SegmentationBraTS2021	CodeCode Available
Generating Steganographic Images via Adversarial Training	Mar 1, 2017	Image Generation	CodeCode Available
Generating Synthetic Data for Text Recognition	Aug 15, 2016	Data AugmentationImage Generation	CodeCode Available

Show:10 25 50

← PrevPage 125 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified