Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3676–3700 of 6689 papers

Title	Date	Tasks	Status
TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification	Jun 25, 2024	image-classificationImage Classification	—Unverified
Multi-LoRA Composition for Image Generation	Feb 26, 2024	DenoisingImage Generation	—Unverified
Z-Magic: Zero-shot Multiple Attributes Guided Image Creator	Jan 1, 2025	AttributeImage Generation	—Unverified
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified
Multi-Metric Evaluation of Thermal-to-Visual Face Recognition	Jul 22, 2020	BIG-bench Machine LearningFace Identification	—Unverified
Multimodal Approaches to Fair Image Classification: An Ethical Perspective	Dec 11, 2024	ClassificationEthics	—Unverified
3D Scene Painting via Semantic Image Synthesis	Jan 1, 2022	3D geometryImage Generation	—Unverified
Multimodal Conditional Image Synthesis with Product-of-Experts GANs	Dec 9, 2021	DiversityImage Generation	—Unverified
Cooperative Training of Fast Thinking Initializer and Slow Thinking Solver for Conditional Learning	Feb 7, 2019	Image GenerationImage-to-Image Translation	—Unverified
Multi-modal Contrastive Learning for Tumor-specific Missing Modality Synthesis	Feb 26, 2025	AnatomyContrastive Learning	—Unverified
Anywhere: A Multi-Agent Framework for User-Guided, Reliable, and Diverse Foreground-Conditioned Image Generation	Apr 29, 2024	DiversityImage Generation	—Unverified
Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization	Oct 4, 2024	Image GenerationStyle Transfer	—Unverified
Turbo Learning for Captionbot and Drawingbot	May 21, 2018	Image CaptioningImage Generation	—Unverified
Multimodal Image-to-Image Translation via Mutual Information Estimation and Maximization	Aug 8, 2020	DisentanglementDiversity	—Unverified
Multimodal Intelligence: Representation Learning, Information Fusion, and Applications	Nov 10, 2019	Caption GenerationImage Generation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
Multimodal Large Language Model is a Human-Aligned Annotator for Text-to-Image Generation	Apr 23, 2024	Image GenerationLanguage Modeling	—Unverified
TWIG: Two-Step Image Generation using Segmentation Masks in Diffusion Models	Apr 21, 2025	Image GenerationImage Segmentation	—Unverified
AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks	Nov 24, 2024	Few-Shot Object DetectionImage Generation	—Unverified
Multi-object Video Generation from Single Frame Layouts	May 6, 2023	Image GenerationObject	—Unverified
Multi-party Collaborative Attention Control for Image Customization	Jan 1, 2025	Image Generation	—Unverified
Multi Positive Contrastive Learning with Pose-Consistent Generated Images	Apr 4, 2024	Contrastive LearningImage Generation	—Unverified
Twin Co-Adaptive Dialogue for Progressive Image Generation	Apr 21, 2025	Image GenerationText to Image Generation	—Unverified
Multi-scale Conditional Generative Modeling for Microscopic Image Restoration	Jul 7, 2024	DiversityImage Generation	—Unverified
Multi-Scale Diffusion: Enhancing Spatial Layout in High-Resolution Panoramic Image Generation	Oct 24, 2024	Image Generation	—Unverified

Show:10 25 50

← PrevPage 148 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified