Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3401–3450 of 6689 papers

Title	Date	Tasks	Status
Flow Guided Transformable Bottleneck Networks for Motion Retargeting	Jun 14, 2021	Image Generationmotion retargeting	—Unverified
Flowing from Words to Pixels: A Framework for Cross-Modality Evolution	Dec 19, 2024	Depth EstimationImage Captioning	—Unverified
Flowing from Words to Pixels: A Noise-Free Framework for Cross-Modality Evolution	Jan 1, 2025	Depth EstimationImage Captioning	—Unverified
Beyond Generation: A Diffusion-based Low-level Feature Extractor for Detecting AI-generated Images	Jan 1, 2025	DenoisingImage Generation	—Unverified
Beyond Finite Data: Towards Data-free Out-of-distribution Generalization via Extrapolation	Mar 8, 2024	Domain GeneralizationImage Generation	—Unverified
Beyond Blur: A Fluid Perspective on Generative Diffusion Models	Jun 20, 2025	DiversityGPU	—Unverified
Flow Matching with General Discrete Paths: A Kinetic-Optimal Perspective	Dec 4, 2024	Image GenerationText Generation	—Unverified
Beware of diffusion models for synthesizing medical images -- A comparison with GANs in terms of memorizing brain MRI and chest x-ray images	May 12, 2023	Image GenerationText to Image Generation	—Unverified
Beware of Aliases -- Signal Preservation is Crucial for Robust Image Restoration	Jun 11, 2024	DecoderImage Generation	—Unverified
Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization	Mar 14, 2025	Image CompressionImage Generation	—Unverified
Beta Sampling is All You Need: Efficient Image Generation Strategy for Diffusion Models using Stepwise Spectral Analysis	Jul 16, 2024	AllDenoising	—Unverified
Bespoke Non-Stationary Solvers for Fast Sampling of Diffusion and Flow Models	Mar 2, 2024	Audio GenerationConditional Image Generation	—Unverified
FluxSpace: Disentangled Semantic Editing in Rectified Flow Transformers	Dec 12, 2024	AttributeDisentanglement	—Unverified
FluxSpace: Disentangled Semantic Editing in Rectified Flow Models	Jan 1, 2025	AttributeDisentanglement	—Unverified
Focusing Image Generation to Mitigate Spurious Correlations	Dec 27, 2024	AttributeData Augmentation	—Unverified
Focus-N-Fix: Region-Aware Fine-Tuning for Text-to-Image Generation	Jan 11, 2025	Image GenerationText to Image Generation	—Unverified
Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN	Aug 3, 2023	Image GenerationImage Reconstruction	—Unverified
Benefiting Deep Latent Variable Models via Learning the Prior and Removing Latent Regularization	Jul 7, 2020	DisentanglementDiversity	—Unverified
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation	Jun 12, 2024	Image GenerationText to Image Generation	—Unverified
FontTransformer: Few-shot High-resolution Chinese Glyph Image Synthesis via Stacked Transformers	Oct 12, 2022	Few-Shot LearningFont Generation	—Unverified
FoodFusion: A Latent Diffusion Model for Realistic Food Image Generation	Dec 6, 2023	DiversityImage Generation	—Unverified
Foodfusion: A Novel Approach for Food Image Composition via Diffusion Models	Aug 26, 2024	DenoisingImage Generation	—Unverified
TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering	Nov 28, 2023	DiversityImage Generation	—Unverified
FoolSDEdit: Deceptively Steering Your Edits Towards Targeted Attribute-aware Distribution	Feb 6, 2024	Adversarial AttackAttribute	—Unverified
TextDiffuser-RL: Efficient and Robust Text Layout Optimization for High-Fidelity Text-to-Image Synthesis	May 25, 2025	CPUGPU	—Unverified
Foreground Focus: Enhancing Coherence and Fidelity in Camouflaged Image Generation	Apr 2, 2025	DenoisingImage Generation	—Unverified
Editing 3D Scenes via Text Prompts without Retraining	Sep 10, 2023	3D scene Editing3D Scene Reconstruction	—Unverified
A Comprehensive Survey on Synthetic Infrared Image synthesis	Aug 13, 2024	Image GenerationSurvey	—Unverified
Text-driven Visual Synthesis with Latent Diffusion Prior	Feb 16, 2023	DecoderImage Generation	—Unverified
Text Embedding is Not All You Need: Attention Control for Text-to-Image Semantic Alignment with Text Self-Attention Maps	Nov 21, 2024	AllAttribute	—Unverified
Foundation Cures Personalization: Recovering Facial Personalized Models' Prompt Consistency	Nov 22, 2024	DenoisingImage Generation	—Unverified
Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions	Sep 7, 2022	Image GenerationText to Image Generation	—Unverified
FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation	Dec 3, 2024	Image Generation	—Unverified
Fourier-CPPNs for Image Synthesis	Sep 20, 2019	Image Generation	—Unverified
Text-guided Controllable Mesh Refinement for Interactive 3D Modeling	Jun 3, 2024	Image Generation	—Unverified
FRAbench and GenEval: Scaling Fine-Grained Aspect Evaluation across Tasks, Modalities	May 19, 2025	Image GenerationText Generation	—Unverified
Behavior Optimized Image Generation	Nov 18, 2023	Image GenerationMarketing	—Unverified
FrameBreak: Dramatic Image Extrapolation by Guided Shift-Maps	Jun 1, 2013	Image Generation	—Unverified
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models	Mar 28, 2024	Image GenerationVideo Generation	—Unverified
Text Guided Person Image Synthesis	Apr 10, 2019	AttributeImage Generation	—Unverified
FRAP: Faithful and Realistic Text-to-Image Generation with Adaptive Prompt Weighting	Aug 21, 2024	Image GenerationText to Image Generation	—Unverified
FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models	Dec 6, 2023	DenoisingImage Generation	—Unverified
FREA-Unet: Frequency-aware U-net for Modality Transfer	Dec 31, 2020	Image Generation	—Unverified
A Comprehensive Survey on Data-Efficient GANs in Image Generation	Apr 18, 2022	Image GenerationSurvey	—Unverified
Fréchet Distance for Offline Evaluation of Information Retrieval Systems with Sparse Labels	Jan 31, 2024	Image GenerationInformation Retrieval	—Unverified
BeautyBank: Encoding Facial Makeup in Latent Space	Nov 18, 2024	Image Generation	—Unverified
FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process	Sep 11, 2024	DenoisingImage Enhancement	—Unverified
FreeFlux: Understanding and Exploiting Layer-Specific Roles in RoPE-Based MMDiT for Versatile Image Editing	Mar 20, 2025	Image GenerationPosition	—Unverified
Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation	Mar 10, 2024	Anomaly DetectionImage Generation	—Unverified
Free-Lunch Color-Texture Disentanglement for Stylized Image Generation	Mar 18, 2025	DisentanglementImage Generation	—Unverified

Show:10 25 50

← PrevPage 69 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified