Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 6689 papers

Title	Date	Tasks	Status
A Pipeline for Vision-Based On-Orbit Proximity Operations Using Deep Learning and Synthetic Imagery	Jan 14, 2021	Deep LearningImage Generation	—Unverified
MSF: Efficient Diffusion Model Via Multi-Scale Latent Factorize	Jan 23, 2025	Image Generation	—Unverified
MSGDD-cGAN: Multi-Scale Gradients Dual Discriminator Conditional Generative Adversarial Network	Sep 12, 2021	Conditional Image GenerationGenerative Adversarial Network	—Unverified
3D-WAG: Hierarchical Wavelet-Guided Autoregressive Generation for High-Fidelity 3D Shapes	Nov 28, 2024	3D Shape ModelingImage Generation	—Unverified
A Picture is Worth a Thousand Words: Principled Recaptioning Improves Image Generation	Oct 25, 2023	Image CaptioningImage Generation	—Unverified
A Picture is Worth a Thousand Prompts? Efficacy of Iterative Human-Driven Prompt Refinement in Image Regeneration Tasks	Apr 29, 2025	Image Generation	—Unverified
MULAN: A Multi Layer Annotated Dataset for Controllable Text-to-Image Generation	Apr 3, 2024	Image GenerationPrompt Engineering	—Unverified
Multi-Adversarial Variational Autoencoder Networks	Jun 14, 2019	ClusteringGeneral Classification	—Unverified
Multi-Architecture Multi-Expert Diffusion Models	Jun 8, 2023	DenoisingImage Generation	—Unverified
Multi-Attributed and Structured Text-to-Face Synthesis	Aug 25, 2021	DescriptiveDiversity	—Unverified
A Physics-Inspired Optimizer: Velocity Regularized Adam	May 19, 2025	image-classificationImage Classification	—Unverified
Multiclass non-Adversarial Image Synthesis, with Application to Classification from Very Small Sample	Nov 25, 2020	CoLADiversity	—Unverified
Multi-Concept T2I-Zero: Tweaking Only The Text Embeddings and Nothing Else	Oct 11, 2023	Image GenerationImage Manipulation	—Unverified
Multi-Conditioned Denoising Diffusion Probabilistic Model (mDDPM) for Medical Image Synthesis	Sep 7, 2024	AnatomyDenoising	—Unverified
Multi-Density Sketch-to-Image Translation Network	Jun 18, 2020	ColorizationImage Generation	—Unverified
MultiDiff: Consistent Novel View Synthesis from a Single Image	Jun 26, 2024	Image GenerationNovel View Synthesis	—Unverified
ParallelEdits: Efficient Multi-object Image Editing	Jun 3, 2024	AttributeImage Generation	—Unverified
Multi-Energy Guided Image Translation with Stochastic Differential Equations for Near-Infrared Facial Expression Recognition	Dec 10, 2023	Facial Expression RecognitionFacial Expression Recognition (FER)	—Unverified
Multi-Exposure HDR Composition by Gated Swin Transformer	Mar 15, 2023	feature selectionImage Generation	—Unverified
Multi-Faceted Multimodal Monosemanticity	Feb 16, 2025	AttributeImage Generation	—Unverified
3D-SSGAN: Lifting 2D Semantics for 3D-Aware Compositional Portrait Synthesis	Jan 8, 2024	DisentanglementImage Generation	—Unverified
Multi-Forgery Detection Challenge 2022: Push the Frontier of Unconstrained and Diverse Forgery Detection	Jul 27, 2022	Image Forgery DetectionImage Generation	—Unverified
Multi-Group Proportional Representation for Text-to-Image Models	May 29, 2025	Image Generation	—Unverified
Multi-Group Proportional Representations for Text-to-Image Models	Jan 1, 2025	Image Generation	—Unverified
MultiHuman-Testbench: Benchmarking Image Generation for Multiple Humans	Jun 25, 2025	Action DetectionBenchmarking	—Unverified
TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification	Jun 25, 2024	image-classificationImage Classification	—Unverified
Multi-LoRA Composition for Image Generation	Feb 26, 2024	DenoisingImage Generation	—Unverified
Z-Magic: Zero-shot Multiple Attributes Guided Image Creator	Jan 1, 2025	AttributeImage Generation	—Unverified
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified
Multi-Metric Evaluation of Thermal-to-Visual Face Recognition	Jul 22, 2020	BIG-bench Machine LearningFace Identification	—Unverified
Multimodal Approaches to Fair Image Classification: An Ethical Perspective	Dec 11, 2024	ClassificationEthics	—Unverified
3D Scene Painting via Semantic Image Synthesis	Jan 1, 2022	3D geometryImage Generation	—Unverified
Multimodal Conditional Image Synthesis with Product-of-Experts GANs	Dec 9, 2021	DiversityImage Generation	—Unverified
Cooperative Training of Fast Thinking Initializer and Slow Thinking Solver for Conditional Learning	Feb 7, 2019	Image GenerationImage-to-Image Translation	—Unverified
Multi-modal Contrastive Learning for Tumor-specific Missing Modality Synthesis	Feb 26, 2025	AnatomyContrastive Learning	—Unverified
Anywhere: A Multi-Agent Framework for User-Guided, Reliable, and Diverse Foreground-Conditioned Image Generation	Apr 29, 2024	DiversityImage Generation	—Unverified
Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization	Oct 4, 2024	Image GenerationStyle Transfer	—Unverified
Turbo Learning for Captionbot and Drawingbot	May 21, 2018	Image CaptioningImage Generation	—Unverified
Multimodal Image-to-Image Translation via Mutual Information Estimation and Maximization	Aug 8, 2020	DisentanglementDiversity	—Unverified
Multimodal Intelligence: Representation Learning, Information Fusion, and Applications	Nov 10, 2019	Caption GenerationImage Generation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
Multimodal Large Language Model is a Human-Aligned Annotator for Text-to-Image Generation	Apr 23, 2024	Image GenerationLanguage Modeling	—Unverified
TWIG: Two-Step Image Generation using Segmentation Masks in Diffusion Models	Apr 21, 2025	Image GenerationImage Segmentation	—Unverified
AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks	Nov 24, 2024	Few-Shot Object DetectionImage Generation	—Unverified
Multi-object Video Generation from Single Frame Layouts	May 6, 2023	Image GenerationObject	—Unverified
Multi-party Collaborative Attention Control for Image Customization	Jan 1, 2025	Image Generation	—Unverified
Multi Positive Contrastive Learning with Pose-Consistent Generated Images	Apr 4, 2024	Contrastive LearningImage Generation	—Unverified
Twin Co-Adaptive Dialogue for Progressive Image Generation	Apr 21, 2025	Image GenerationText to Image Generation	—Unverified
Multi-scale Conditional Generative Modeling for Microscopic Image Restoration	Jul 7, 2024	DiversityImage Generation	—Unverified
Multi-Scale Diffusion: Enhancing Spatial Layout in High-Resolution Panoramic Image Generation	Oct 24, 2024	Image Generation	—Unverified

Show:10 25 50

← PrevPage 74 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified