Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2726–2750 of 6689 papers

Title	Date	Tasks	Status
TruePose: Human-Parsing-guided Attention Diffusion for Full-ID Preserving Pose Transfer	Feb 5, 2025	DenoisingHuman Parsing	—Unverified
On Fairness of Unified Multimodal Large Language Model for Image Generation	Feb 5, 2025	FairnessImage Generation	—Unverified
Poisson Flow Joint Model for Multiphase contrast-enhanced CT	Feb 5, 2025	Conditional Image GenerationImage Generation	—Unverified
Masked Autoencoders Are Effective Tokenizers for Diffusion Models	Feb 5, 2025	Image Generation	—Unverified
When are Diffusion Priors Helpful in Sparse Reconstruction? A Study with Sparse-view CT	Feb 4, 2025	Computed Tomography (CT)Image Generation	—Unverified
Layer Separation: Adjustable Joint Space Width Images Synthesis in Conventional Radiography	Feb 4, 2025	DiagnosticImage Generation	—Unverified
Diffusion Instruction Tuning	Feb 4, 2025	Image Generation	—Unverified
AAD-DCE: An Aggregated Multimodal Attention Mechanism for Early and Late Dynamic Contrast Enhanced Prostate MRI Synthesis	Feb 4, 2025	AnatomyGenerative Adversarial Network	CodeCode Available
Towards Consistent and Controllable Image Synthesis for Face Editing	Feb 4, 2025	AttributeDenoising	—Unverified
CoRPA: Adversarial Image Generation for Chest X-rays Using Concept Vector Perturbations and Generative Models	Feb 4, 2025	Adversarial AttackDiagnostic	—Unverified
Unpaired Deblurring via Decoupled Diffusion Model	Feb 3, 2025	DeblurringImage Deblurring	—Unverified
Texture Image Synthesis Using Spatial GAN Based on Vision Transformers	Feb 3, 2025	Generative Adversarial NetworkImage Generation	—Unverified
RealRAG: Retrieval-augmented Realistic Image Generation via Self-reflective Contrastive Learning	Feb 2, 2025	Contrastive LearningImage Generation	—Unverified
Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation	Feb 2, 2025	Drug DiscoveryImage Generation	CodeCode Available
CAT Pruning: Cluster-Aware Token Pruning For Text-to-Image Diffusion Models	Feb 1, 2025	DenoisingImage Generation	CodeCode Available
Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation	Feb 1, 2025	Image GenerationVideo Generation	—Unverified
Fast Solvers for Discrete Diffusion Models: Theory and Applications of High-Order Algorithms	Feb 1, 2025	Image GenerationText Generation	—Unverified
Distorting Embedding Space for Safety: A Defense Mechanism for Adversarially Robust Diffusion Models	Jan 31, 2025	Image Generation	CodeCode Available
BCAT: A Block Causal Transformer for PDE Foundation Models for Fluid Dynamics	Jan 31, 2025	8kImage Generation	—Unverified
Ambient Denoising Diffusion Generative Adversarial Networks for Establishing Stochastic Object Models from Noisy Image Data	Jan 31, 2025	Computed Tomography (CT)Denoising	—Unverified
REG: Rectified Gradient Guidance for Conditional Diffusion Models	Jan 31, 2025	Image GenerationText to Image Generation	—Unverified
Diffusion Autoencoders are Scalable Image Tokenizers	Jan 30, 2025	Image GenerationImage Reconstruction	—Unverified
Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment	Jan 29, 2025	Image EnhancementImage Generation	CodeCode Available
Generative AI for Vision: A Comprehensive Study of Frameworks and Applications	Jan 29, 2025	Image GenerationImage-to-Image Translation	—Unverified
DebiasPI: Inference-time Debiasing by Prompt Iteration of a Text-to-Image Generative Model	Jan 28, 2025	AttributeImage Generation	—Unverified

Show:10 25 50

← PrevPage 110 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified