Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5251–5300 of 6689 papers

Title	Date	Tasks	Status
Diff4MMLiTS: Advanced Multimodal Liver Tumor Segmentation via Diffusion-Based Image Synthesis and Alignment	Dec 29, 2024	Image GenerationSegmentation	—Unverified
DiffAD: A Unified Diffusion Modeling Approach for Autonomous Driving	Mar 15, 2025	Autonomous DrivingBench2Drive	—Unverified
Adaptive Multi-stage Density Ratio Estimation for Learning Latent Space Energy-based Model	Sep 19, 2022	Anomaly DetectionDensity Ratio Estimation	—Unverified
DiffBrush:Just Painting the Art by Your Hands	Feb 28, 2025	DenoisingImage Generation	—Unverified
DiffCap: Exploring Continuous Diffusion on Image Captioning	May 20, 2023	Caption GenerationDiversity	—Unverified
Diff-CAPTCHA: An Image-based CAPTCHA with Security Enhanced by Denoising Diffusion Model	Aug 16, 2023	DenoisingDiversity	—Unverified
DiffChat: Learning to Chat with Text-to-Image Synthesis Models for Interactive Image Creation	Mar 8, 2024	Image GenerationInstruction Following	—Unverified
DiffCollage: Parallel Generation of Large Content with Diffusion Models	Mar 30, 2023	Image GenerationInfinite Image Generation	—Unverified
Adaptive Multiplane Image Generation from a Single Internet Picture	Nov 26, 2020	Depth EstimationImage Generation	—Unverified
Diff-CXR: Report-to-CXR generation through a disease-knowledge enhanced diffusion model	Oct 26, 2024	Image Generation	—Unverified
Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases	Mar 25, 2024	Image Generation	—Unverified
DiffDis: Empowering Generative Diffusion Model with Cross-Modal Discrimination Capability	Aug 18, 2023	Image Generationzero-shot-classification	—Unverified
Style Generation: Image Synthesis based on Coarsely Matched Texts	Sep 8, 2023	Generative Adversarial NetworkImage Generation	—Unverified
Cache Me if You Can: Accelerating Diffusion Models through Block Caching	Dec 6, 2023	DenoisingImage Generation	—Unverified
C4Synth: Cross-Caption Cycle-Consistent Text-to-Image Synthesis	Sep 20, 2018	Image Generation	—Unverified
Bridging Scales in Map Generation: A scale-aware cascaded generative mapping framework for seamless and consistent multi-scale cartographic representation	Feb 7, 2025	Image Generation	—Unverified
Buster: Implanting Semantic Backdoor into Text Encoder to Mitigate NSFW Content Generation	Dec 10, 2024	Image Generation	—Unverified
Style-Guided Inference of Transformer for High-resolution Image Synthesis	Oct 11, 2022	Image GenerationVocal Bursts Intensity Prediction	—Unverified
Differentially Private Diffusion Models Generate Useful Synthetic Images	Feb 27, 2023	Image GenerationPrivacy Preserving	—Unverified
Differentially Private Fine-Tuning of Diffusion Models	Jun 3, 2024	Image GenerationMemorization	—Unverified
Build-A-Scene: Interactive 3D Layout Control for Diffusion-Based Image Generation	Aug 27, 2024	Image GenerationObject	—Unverified
StyleHumanCLIP: Text-guided Garment Manipulation for StyleGAN-Human	May 26, 2023	DiversityImage Generation	—Unverified
DiffGAN: A Test Generation Approach for Differential Testing of Deep Neural Networks	Oct 15, 2024	DiversityGenerative Adversarial Network	—Unverified
DiffGAR: Model-Agnostic Restoration from Generative Artifacts Using Image-to-Image Diffusion Models	Oct 16, 2022	Image GenerationImage Restoration	—Unverified
StyleInject: Parameter Efficient Tuning of Text-to-Image Diffusion Models	Jan 25, 2024	DiversityImage Generation	—Unverified
DiffI2I: Efficient Diffusion Model for Image-to-Image Translation	Aug 26, 2023	DenoisingImage Generation	—Unverified
Style Intervention: How to Achieve Spatial Disentanglement with Style-based Generators?	Nov 19, 2020	AttributeDisentanglement	—Unverified
BudgetFusion: Perceptually-Guided Adaptive Diffusion Models	Dec 8, 2024	DenoisingImage Generation	—Unverified
DiffLoRA: Generating Personalized Low-Rank Adaptation Weights with Diffusion	Aug 13, 2024	Image GenerationText to Image Generation	—Unverified
Diff-MM: Exploring Pre-trained Text-to-Image Generation Model for Unified Multi-modal Object Tracking	May 19, 2025	Image GenerationObject Tracking	—Unverified
DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers	Mar 18, 2025	Image GenerationText to Image Generation	—Unverified
Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models	Apr 15, 2025	DenoisingGPU	—Unverified
DiffMorph: Text-less Image Morphing with Diffusion Models	Jan 1, 2024	Image GenerationImage Morphing	—Unverified
DIFFNAT: Improving Diffusion Image Quality Using Natural Image Statistics	Nov 16, 2023	Image GenerationImage Super-Resolution	—Unverified
DIFF-NST: Diffusion Interleaving For deFormable Neural Style Transfer	Jul 9, 2023	Image GenerationStyle Transfer	—Unverified
Diff-Oracle: Deciphering Oracle Bone Scripts with Controllable Diffusion Model	Dec 21, 2023	Image GenerationImage-to-Image Translation	—Unverified
Diff-Plugin: Revitalizing Details for Diffusion-based Low-level Tasks	Mar 1, 2024	Image Generation	—Unverified
DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose Estimation	Jul 31, 2023	DenoisingImage Generation	—Unverified
Vision-Driven Prompt Optimization for Large Language Models in Multimodal Generative Tasks	Jan 5, 2025	Image Generation	—Unverified
ArtWeaver: Advanced Dynamic Style Integration via Diffusion Model	May 24, 2024	DenoisingImage Generation	—Unverified
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model	Aug 25, 2023	Conditional Image GenerationImage Enhancement	—Unverified
StyleMC: Multi-Channel Based Fast Text-Guided Image Generation and Manipulation	Dec 15, 2021	Image GenerationPrompt Engineering	—Unverified
DiffS2UT: A Semantic Preserving Diffusion Model for Textless Direct Speech-to-Speech Translation	Oct 26, 2023	Image GenerationSpeech-to-Speech Translation	—Unverified
Diffscaler: Enhancing the Generative Prowess of Diffusion Transformers	Apr 15, 2024	Image GenerationUnconditional Image Generation	—Unverified
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation	Dec 10, 2024	Image GenerationLanguage Modelling	—Unverified
Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation	Jul 11, 2025	Image GenerationImage Reconstruction	—Unverified
DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models	Sep 26, 2024	Autonomous DrivingDenoising	—Unverified
One Framework to Rule Them All: Unifying Multimodal Tasks with LLM Neural-Tuning	Aug 6, 2024	AllImage Captioning	—Unverified
DiffSynth: Latent In-Iteration Deflickering for Realistic Video Synthesis	Aug 7, 2023	Image Generation	—Unverified
DiffUCD:Unsupervised Hyperspectral Image Change Detection with Semantic Correlation Diffusion Model	May 21, 2023	Change DetectionContrastive Learning	—Unverified

Show:10 25 50

← PrevPage 106 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified