Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6001–6025 of 6689 papers

Title	Date	Tasks	Status
Text Guided Person Image Synthesis	Apr 10, 2019	AttributeImage Generation	—Unverified
FRAP: Faithful and Realistic Text-to-Image Generation with Adaptive Prompt Weighting	Aug 21, 2024	Image GenerationText to Image Generation	—Unverified
FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models	Dec 6, 2023	DenoisingImage Generation	—Unverified
FREA-Unet: Frequency-aware U-net for Modality Transfer	Dec 31, 2020	Image Generation	—Unverified
A Comprehensive Survey on Data-Efficient GANs in Image Generation	Apr 18, 2022	Image GenerationSurvey	—Unverified
Fréchet Distance for Offline Evaluation of Information Retrieval Systems with Sparse Labels	Jan 31, 2024	Image GenerationInformation Retrieval	—Unverified
BeautyBank: Encoding Facial Makeup in Latent Space	Nov 18, 2024	Image Generation	—Unverified
FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process	Sep 11, 2024	DenoisingImage Enhancement	—Unverified
FreeFlux: Understanding and Exploiting Layer-Specific Roles in RoPE-Based MMDiT for Versatile Image Editing	Mar 20, 2025	Image GenerationPosition	—Unverified
Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation	Mar 10, 2024	Anomaly DetectionImage Generation	—Unverified
Free-Lunch Color-Texture Disentanglement for Stylized Image Generation	Mar 18, 2025	DisentanglementImage Generation	—Unverified
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models	Mar 29, 2024	Image GenerationImage Segmentation	—Unverified
Textile Pattern Generation Using Diffusion Models	Apr 2, 2023	Image Generation	—Unverified
FreeTuner: Any Subject in Any Style with Training-free Diffusion	May 23, 2024	DisentanglementImage Generation	—Unverified
FreeVS: Generative View Synthesis on Free Driving Trajectory	Oct 23, 2024	Image GenerationNovel View Synthesis	—Unverified
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
Frequency-Aware Guidance for Blind Image Restoration via Diffusion Models	Nov 19, 2024	Blind Image DeblurringDeblurring	—Unverified
Text Image Generation for Low-Resource Languages with Dual Translation Learning	Sep 26, 2024	DiversityImage Generation	—Unverified
Frequency-Time Diffusion with Neural Cellular Automata	Jan 11, 2024	DenoisingImage Generation	—Unverified
ViUniT: Visual Unit Tests for More Robust Visual Programming	Dec 12, 2024	Image GenerationImage-text matching	—Unverified
FRMD: Fast Robot Motion Diffusion with Consistency-Distilled Movement Primitives for Smooth Action Generation	Mar 3, 2025	Action GenerationDenoising	—Unverified
From Bird's-Eye to Street View: Crafting Diverse and Condition-Aligned Images with Latent Diffusion Model	Sep 2, 2024	Autonomous DrivingConditional Image Generation	—Unverified
From Diffusion to Resolution: Leveraging 2D Diffusion Models for 3D Super-Resolution Task	Nov 25, 2024	Image GenerationImage Super-Resolution	—Unverified
From Graph Diffusion to Graph Classification	Nov 26, 2024	ClassificationGraph Classification	—Unverified
TextPainter: Multimodal Text Image Generation with Visual-harmony and Text-comprehension for Poster Design	Aug 9, 2023	Image GenerationLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 241 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified