Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5001–5050 of 6689 papers

Title	Date	Tasks	Status
CRD-CGAN: Category-Consistent and Relativistic Constraints for Diverse Text-to-Image Generation	Jul 28, 2021	DiversityImage Generation	—Unverified
Create Your World: Lifelong Text-to-Image Diffusion	Sep 8, 2023	AttributeImage Generation	—Unverified
CreatiLayout: Siamese Multimodal Diffusion Transformer for Creative Layout-to-Image Generation	Dec 5, 2024	Image GenerationLayout Generation	—Unverified
Creating cloud-free satellite imagery from image time series with deep learning	Nov 1, 2020	Image GenerationMissing Values	—Unverified
Creatively Upscaling Images with Global-Regional Priors	May 22, 2025	DenoisingDescriptive	—Unverified
Creative Painting with Latent Diffusion Models	Sep 29, 2022	Image Generation	—Unverified
ST-DDPM: Explore Class Clustering for Conditional Diffusion Probabilistic Models	Sep 29, 2021	ClusteringConditional Image Generation	—Unverified
Creativity in LLM-based Multi-Agent Systems: A Survey	May 27, 2025	Image GenerationLanguage Modeling	—Unverified
Critical windows: non-asymptotic theory for feature emergence in diffusion models	Mar 3, 2024	FairnessImage Generation	—Unverified
CROPS: Model-Agnostic Training-Free Framework for Safe Image Synthesis with Latent Diffusion Models	Jan 9, 2025	Image Generation	—Unverified
st-DTPM: Spatial-Temporal Guided Diffusion Transformer Probabilistic Model for Delayed Scan PET Image Prediction	Oct 30, 2024	DenoisingImage Generation	—Unverified
Cross-attention for State-based model RWKV-7	Apr 19, 2025	cross-modal alignmentImage Generation	—Unverified
SteerDiff: Steering towards Safe Text-to-Image Diffusion Models	Oct 3, 2024	Image GenerationRed Teaming	—Unverified
Cross-Domain Cascaded Deep Translation	Aug 1, 2020	Image GenerationImage-to-Image Translation	—Unverified
Cross-Domain Conditional Generative Adversarial Networks for Stereoscopic Hyperrealism in Surgical Training	Jun 24, 2019	Generative Adversarial NetworkImage Generation	—Unverified
Cross Domain Image Generation through Latent Space Exploration with Adversarial Loss	May 24, 2018	Image Generation	—Unverified
Cross-domain Microscopy Cell Counting by Disentangled Transfer Learning	Nov 26, 2022	Image GenerationTransfer Learning	—Unverified
Steering Rectified Flow Models in the Vector Field for Controlled Image Generation	Nov 27, 2024	DenoisingImage Generation	—Unverified
Stellar: Systematic Evaluation of Human-Centric Personalized Text-to-Image Methods	Dec 11, 2023	Image GenerationText to Image Generation	—Unverified
Cross-Modal Contrastive Representation Learning for Audio-to-Image Generation	Jul 20, 2022	Image GenerationRepresentation Learning	—Unverified
Cross-modality image synthesis from TOF-MRA to CTA using diffusion-based models	Sep 16, 2024	DiagnosticImage Generation	—Unverified
Cross-modality image synthesis from unpaired data using CycleGAN: Effects of gradient consistency loss and training data size	Mar 18, 2018	Image Generation	—Unverified
A Deep Learning Generative Model Approach for Image Synthesis of Plant Leaves	Nov 5, 2021	Anomaly DetectionColorization	—Unverified
Cross-Modal Retrieval and Synthesis (X-MRS): Closing the Modality Gap in Shared Representation Learning	Dec 2, 2020	Cross-Modal RetrievalImage Generation	—Unverified
Cross-Spectrum Dual-Subspace Pairing for RGB-infrared Cross-Modality Person Re-Identification	Feb 29, 2020	Cross-Modality Person Re-identificationImage Generation	—Unverified
CrossViewDiff: A Cross-View Diffusion Model for Satellite-to-Street View Synthesis	Aug 27, 2024	DenoisingImage Generation	—Unverified
StEP: Style-based Encoder Pre-training for Multi-modal Image Synthesis	Apr 14, 2021	Image GenerationTranslation	—Unverified
A Deep Generative Deconvolutional Image Model	Dec 23, 2015	Dictionary LearningImage Generation	—Unverified
Cross-View Image Synthesis with Deformable Convolution and Attention Mechanism	Jul 20, 2020	Image Generation	—Unverified
Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information	Mar 22, 2024	3D ReconstructionHallucination	—Unverified
StereoGen: High-quality Stereo Image Generation from a Single Image	Jan 15, 2025	Depth EstimationImage Generation	—Unverified
Efficient Visualization of Neural Networks with Generative Models and Adversarial Perturbations	Sep 20, 2024	Image Generation	—Unverified
Cartoondiff: Training-free Cartoon Image Generation with Diffusion Transformer Models	Sep 15, 2023	DenoisingImage Generation	—Unverified
Stereotypes and Smut: The (Mis)representation of Non-cisgender Identities by Text-to-Image Models	May 26, 2023	Image Generation	—Unverified
CSG: A Context-Semantic Guided Diffusion Approach in De Novo Musculoskeletal Ultrasound Image Generation	Dec 8, 2024	Image GenerationSemantic Segmentation	—Unverified
CSGO: Content-Style Composition in Text-to-Image Generation	Aug 29, 2024	Image GenerationStyle Transfer	—Unverified
CTGAN: Semantic-guided Conditional Texture Generator for 3D Shapes	Feb 8, 2024	Image GenerationTexture Synthesis	—Unverified
CT Image Synthesis Using Weakly Supervised Segmentation and Geometric Inter-Label Relations For COVID Image Analysis	Jun 15, 2021	Data AugmentationDiversity	—Unverified
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model	Apr 15, 2024	GPUImage Generation	—Unverified
CtrlNeRF: The Generative Neural Radiation Fields for the Controllable Synthesis of High-fidelity 3D-Aware Images	Dec 1, 2024	3D geometryImage Generation	—Unverified
CTRL-O: Language-Controllable Object-Centric Visual Representation Learning	Mar 27, 2025	Image GenerationObject	—Unverified
CART: Compositional Auto-Regressive Transformer for Image Generation	Nov 15, 2024	Image GenerationLanguage Modeling	—Unverified
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling	Oct 15, 2024	Conditional Image GenerationImage Generation	—Unverified
Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance	Jun 11, 2024	Appearance TransferImage Generation	—Unverified
CT Synthesis with Conditional Diffusion Models for Abdominal Lymph Node Segmentation	Mar 26, 2024	DenoisingDiversity	—Unverified
Culture-TRIP: Culturally-Aware Text-to-Image Generation with Iterative Prompt Refinement	Feb 24, 2025	Image GenerationText to Image Generation	—Unverified
Cumulant GAN	Jun 11, 2020	Image Generation	—Unverified
Current State of Community-Driven Radiological AI Deployment in Medical Imaging	Dec 29, 2022	Image GenerationMedical Image Generation	—Unverified
Cardiac ultrasound simulation for autonomous ultrasound navigation	Feb 9, 2024	DiagnosticGPU	—Unverified
A Deep Bayesian Nonparametric Framework for Robust Mutual Information Estimation	Mar 11, 2025	Image GenerationMutual Information Estimation	—Unverified

Show:10 25 50

← PrevPage 101 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified