Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 526–550 of 6689 papers

Title	Date	Tasks	Status	Hype
Boosting Resolution Generalization of Diffusion Transformers with Randomized Positional Encodings	Mar 24, 2025	Data AugmentationImage Cropping	—Unverified	0
Equivariant Image Modeling	Mar 24, 2025	Image GenerationZero-shot Generalization	CodeCode Available	1
An Image-like Diffusion Method for Human-Object Interaction Detection	Mar 23, 2025	Human-Object Interaction DetectionImage Generation	—Unverified	0
DeLoRA: Decoupling Angles and Strength in Low-rank Adaptation	Mar 23, 2025	Image GenerationNatural Language Understanding	CodeCode Available	1
TransAnimate: Taming Layer Diffusion to Generate RGBA Video	Mar 23, 2025	Image GenerationVideo Generation	—Unverified	0
Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation	Mar 23, 2025	DiversityImage Generation	CodeCode Available	1
Adoption of Watermarking Measures for AI-Generated Content and Implications under the EU AI Act	Mar 23, 2025	Image Generation	—Unverified	0
TCFG: Tangential Damping Classifier-free Guidance	Mar 23, 2025	Image Generation	—Unverified	0
Efficient Diffusion Training through Parallelization with Truncated Karhunen-Loève Expansion	Mar 22, 2025	DenoisingImage Generation	—Unverified	0
DynASyn: Multi-Subject Personalization Enabling Dynamic Action Synthesis	Mar 22, 2025	Image AugmentationImage Generation	—Unverified	0
TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation	Mar 22, 2025	Image GenerationText to Image Generation	—Unverified	0
OMR-Diffusion:Optimizing Multi-Round Enhanced Training in Diffusion Models for Improved Intent Understanding	Mar 22, 2025	Image Generation	—Unverified	0
FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation	Mar 22, 2025	DiagnosticImage Generation	—Unverified	0
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation	Mar 22, 2025	Image GenerationReinforcement Learning (RL)	—Unverified	0
End-to-end Sketch-Guided Path Planning through Imitation Learning for Autonomous Mobile Robots	Mar 21, 2025	Image GenerationImitation Learning	CodeCode Available	0
Halton Scheduler For Masked Generative Image Transformer	Mar 21, 2025	Image GenerationText to Image Generation	CodeCode Available	3
D2C: Unlocking the Potential of Continuous Autoregressive Image Generation with Discrete Tokens	Mar 21, 2025	Conditional Image GenerationImage Generation	—Unverified	0
Bayesian generative models can flag performance loss, bias, and out-of-distribution image content	Mar 21, 2025	Anomaly DetectionData Visualization	—Unverified	0
Zero-Shot Styled Text Image Generation, but Make It Autoregressive	Mar 21, 2025	Image GenerationText Generation	—Unverified	0
Leveraging Text-to-Image Generation for Handling Spurious Correlation	Mar 21, 2025	image-classificationImage Classification	—Unverified	0
EDiT: Efficient Diffusion Transformers with Linear Compressed Attention	Mar 20, 2025	Image Generation	—Unverified	0
World Knowledge from AI Image Generation for Robot Control	Mar 20, 2025	Image GenerationWorld Knowledge	—Unverified	0
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity	Mar 20, 2025	Image Generation	CodeCode Available	7
Tokenize Image as a Set	Mar 20, 2025	Image Generation	CodeCode Available	2
RL4Med-DDPO: Reinforcement Learning for Controlled Guidance Towards Diverse Medical Image Generation using Vision-Language Foundation Models	Mar 20, 2025	Image GenerationMedical Image Generation	—Unverified	0

Show:10 25 50

← PrevPage 22 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified