Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1451–1500 of 6689 papers

Title	Date	Tasks	Status	Hype
Medical Imaging Complexity and its Effects on GAN Performance	Oct 23, 2024	Image Generation	CodeCode Available	0
Deep Generative Models for 3D Medical Image Synthesis	Oct 23, 2024	DenoisingDiversity	—Unverified	0
Longitudinal Causal Image Synthesis	Oct 23, 2024	counterfactualImage Generation	CodeCode Available	0
Scalable Ranked Preference Optimization for Text-to-Image Generation	Oct 23, 2024	Image GenerationText to Image Generation	—Unverified	0
FreeVS: Generative View Synthesis on Free Driving Trajectory	Oct 23, 2024	Image GenerationNovel View Synthesis	—Unverified	0
A Wavelet Diffusion GAN for Image Super-Resolution	Oct 23, 2024	Dimensionality ReductionImage Generation	—Unverified	0
Offline Evaluation of Set-Based Text-to-Image Generation	Oct 22, 2024	Image GenerationText to Image Generation	CodeCode Available	0
Dual-Model Defense: Safeguarding Diffusion Models from Membership Inference Attacks through Disjoint Data Splitting	Oct 22, 2024	Image GenerationMemorization	—Unverified	0
Hierarchical Clustering for Conditional Diffusion in Image Generation	Oct 22, 2024	ClusteringImage Generation	CodeCode Available	1
MPDS: A Movie Posters Dataset for Image Generation with Diffusion Model	Oct 22, 2024	4k8k	—Unverified	0
IdenBAT: Disentangled Representation Learning for Identity-Preserved Brain Age Transformation	Oct 22, 2024	Image GenerationRepresentation Learning	CodeCode Available	0
DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization	Oct 22, 2024	DenoisingImage Generation	—Unverified	0
Altogether: Image Captioning via Re-aligning Alt-text	Oct 22, 2024	Image Captioningimage-classification	—Unverified	0
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified	0
Elucidating the design space of language models for image generation	Oct 21, 2024	Image GenerationText Generation	CodeCode Available	1
MedDiff-FM: A Diffusion-based Foundation Model for Versatile Medical Image Applications	Oct 20, 2024	Anomaly DetectionDenoising	—Unverified	0
Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step	Oct 19, 2024	Conditional Image GenerationGPU	CodeCode Available	2
SeaS: Few-shot Industrial Anomaly Image Generation with Separation and Sharing Fine-tuning	Oct 19, 2024	Image Generation	CodeCode Available	2
On the Wasserstein Convergence and Straightness of Rectified Flow	Oct 19, 2024	DenoisingImage Generation	CodeCode Available	0
SYNOSIS: Image synthesis pipeline for machine vision in metal surface inspection	Oct 18, 2024	Dataset GenerationDiversity	—Unverified	0
Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion	Oct 18, 2024	Conditional Image GenerationImage Generation	—Unverified	0
Truncated Consistency Models	Oct 18, 2024	DenoisingImage Generation	—Unverified	0
Personalized Image Generation with Large Multimodal Models	Oct 18, 2024	Image GenerationPersonalized Image Generation	CodeCode Available	1
FashionR2R: Texture-preserving Rendered-to-Real Image Translation with Diffusion Models	Oct 18, 2024	Image Generation	—Unverified	0
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities	Oct 18, 2024	Conditional Image GenerationImage Generation	CodeCode Available	2
Parallel Backpropagation for Inverse of a Convolution with Application to Normalizing Flows	Oct 18, 2024	DeblurringGPU	CodeCode Available	0
HiCo: Hierarchical Controllable Diffusion Model for Layout-to-image Generation	Oct 18, 2024	DisentanglementImage Generation	CodeCode Available	2
Assessing Open-world Forgetting in Generative Image Model Customization	Oct 18, 2024	Image Generationzero-shot-classification	—Unverified	0
CFTS-GAN: Continual Few-Shot Teacher Student for Generative Adversarial Networks	Oct 17, 2024	Continual LearningDiversity	—Unverified	0
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model	Oct 17, 2024	Computational EfficiencyImage Cropping	CodeCode Available	3
ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding	Oct 17, 2024	3D Semantic SegmentationImage Generation	CodeCode Available	2
GraspDiffusion: Synthesizing Realistic Whole-body Hand-Object Interaction	Oct 17, 2024	Human-Object Interaction DetectionImage Generation	—Unverified	0
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning	Oct 17, 2024	image-classificationImage Classification	CodeCode Available	0
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model	Oct 17, 2024	Disease PredictionGenerative Adversarial Network	—Unverified	0
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation	Oct 17, 2024	DiversityImage Generation	CodeCode Available	2
MagicTailor: Component-Controllable Personalization in Text-to-Image Diffusion Models	Oct 17, 2024	Image Generation	—Unverified	0
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available	1
Boosting Imperceptibility of Stable Diffusion-based Adversarial Examples Generation with Momentum	Oct 17, 2024	Image GenerationSemantic Similarity	CodeCode Available	0
Deep Generative Models Unveil Patterns in Medical Images Through Vision-Language Conditioning	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available	0
Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens	Oct 17, 2024	Image GenerationText to Image Generation	CodeCode Available	2
Unlocking the Capabilities of Masked Generative Models for Image Synthesis via Self-Guidance	Oct 17, 2024	DiversityImage Generation	CodeCode Available	1
Stable Diffusion with Continuous-time Neural Network	Oct 16, 2024	DenoisingImage Generation	—Unverified	0
On the Relation Between Linear Diffusion and Power Iteration	Oct 16, 2024	DenoisingImage Generation	—Unverified	0
Facing Identity: The Formation and Performance of Identity via Face-Based Artificial Intelligence Technologies	Oct 16, 2024	Image Generation	—Unverified	0
Stabilize the Latent Space for Image Autoregressive Modeling: A Unified Perspective	Oct 16, 2024	Conditional Image GenerationImage Generation	CodeCode Available	2
FaceChain-FACT: Face Adapter with Decoupled Training for Identity-preserved Personalization	Oct 16, 2024	DiversityImage Generation	—Unverified	0
Embedding an Ethical Mind: Aligning Text-to-Image Synthesis via Lightweight Value Optimization	Oct 16, 2024	Image Generation	CodeCode Available	1
3DIS: Depth-Driven Decoupled Instance Synthesis for Text-to-Image Generation	Oct 16, 2024	AttributeImage Generation	CodeCode Available	3
Evaluating Utility of Memory Efficient Medical Image Generation: A Study on Lung Nodule Segmentation	Oct 16, 2024	DenoisingImage Generation	—Unverified	0
DiffGAN: A Test Generation Approach for Differential Testing of Deep Neural Networks	Oct 15, 2024	DiversityGenerative Adversarial Network	—Unverified	0

Show:10 25 50

← PrevPage 30 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified