Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3950 of 6689 papers

Title	Date	Tasks	Status
Towards Label-Efficient Human Matting: A Simple Baseline for Weakly Semi-Supervised Trimap-Free Human Matting	Apr 1, 2024	Domain GeneralizationGPU	CodeCode Available
Is Model Collapse Inevitable? Breaking the Curse of Recursion by Accumulating Real and Synthetic Data	Apr 1, 2024	Image Generation	—Unverified
Model-Agnostic Human Preference Inversion in Diffusion Models	Apr 1, 2024	Image Generationmodel	—Unverified
Convergence of Continuous Normalizing Flows for Learning Probability Distributions	Mar 31, 2024	Image GenerationProtein Structure Prediction	—Unverified
IPT-V2: Efficient Image Processing Transformer using Hierarchical Attentions	Mar 31, 2024	DeblurringDenoising	—Unverified
GAN with Skip Patch Discriminator for Biological Electron Microscopy Image Generation	Mar 31, 2024	Generative Adversarial NetworkImage Generation	—Unverified
CHAIN: Enhancing Generalization in Data-Efficient GANs via lipsCHitz continuity constrAIned Normalization	Mar 31, 2024	Image Generation	CodeCode Available
MaGRITTe: Manipulative and Generative 3D Realization from Image, Topview and Text	Mar 30, 2024	Depth EstimationImage Generation	—Unverified
Grid Diffusion Models for Text-to-Video Generation	Mar 30, 2024	GPUImage Generation	—Unverified
Dependability Evaluation of Stable Diffusion with Soft Errors on the Model Parameters	Mar 30, 2024	Image Generation	—Unverified
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models	Mar 29, 2024	Image GenerationImage Segmentation	—Unverified
FairRAG: Fair Human Generation via Fair Retrieval Augmentation	Mar 29, 2024	DiversityFairness	—Unverified
Explainable Deep Learning: A Visual Analytics Approach with Transition Matrices	Mar 29, 2024	Deep LearningExplainable Artificial Intelligence (XAI)	CodeCode Available
Automated Black-box Prompt Engineering for Personalized Text-to-Image Generation	Mar 28, 2024	Image GenerationIn-Context Learning	—Unverified
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models	Mar 28, 2024	Image GenerationVideo Generation	—Unverified
GANTASTIC: GAN-based Transfer of Interpretable Directions for Disentangled Image Editing in Text-to-Image Diffusion Models	Mar 28, 2024	DiversityImage Generation	—Unverified
Synthetic Medical Imaging Generation with Generative Adversarial Networks For Plain Radiographs	Mar 28, 2024	DiagnosticImage Generation	—Unverified
CLoRA: A Contrastive Approach to Compose Multiple LoRA Models	Mar 28, 2024	Image Generation	—Unverified
Detecting Origin Attribution for Text-to-Image Diffusion Models	Mar 28, 2024	Fake Image DetectionImage Attribution	CodeCode Available
Imperceptible Protection against Style Imitation from Diffusion Models	Mar 28, 2024	Image Generation	—Unverified
QNCD: Quantization Noise Correction for Diffusion Models	Mar 28, 2024	DenoisingImage Generation	CodeCode Available
Collaborative Interactive Evolution of Art in the Latent Space of Deep Generative Models	Mar 28, 2024	Image GenerationNavigate	CodeCode Available
U-Sketch: An Efficient Approach for Sketch to Image Diffusion Models	Mar 27, 2024	DenoisingImage Generation	—Unverified
CPR: Retrieval Augmented Generation for Copyright Protection	Mar 27, 2024	Image GenerationMachine Unlearning	—Unverified
Conditional Wasserstein Distances with Applications in Bayesian OT Flow Matching	Mar 27, 2024	Conditional Image GenerationImage Generation	CodeCode Available
TextCraftor: Your Text Encoder Can be Image Quality Controller	Mar 27, 2024	Image Generation	—Unverified
ECNet: Effective Controllable Text-to-Image Diffusion Models	Mar 27, 2024	DenoisingImage Generation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain	Mar 26, 2024	DenoisingImage Generation	—Unverified
CT Synthesis with Conditional Diffusion Models for Abdominal Lymph Node Segmentation	Mar 26, 2024	DenoisingDiversity	—Unverified
Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases	Mar 25, 2024	Image Generation	—Unverified
SD-DiT: Unleashing the Power of Self-supervised Discrimination in Diffusion Transformer	Mar 25, 2024	DecoderImage Generation	—Unverified
Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation	Mar 25, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
Enhancing Neural Network Representations with Prior Knowledge-Based Normalization	Mar 25, 2024	ClusteringDomain Adaptation	CodeCode Available
DiffusionAct: Controllable Diffusion Autoencoder for One-shot Face Reenactment	Mar 25, 2024	Face ReenactmentImage Generation	—Unverified
An Intermediate Fusion ViT Enables Efficient Text-Image Alignment in Diffusion Models	Mar 25, 2024	Image GenerationText to Image Generation	—Unverified
Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance	Mar 25, 2024	Image Generationobject-detection	—Unverified
Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation	Mar 25, 2024	Image GenerationRelational Reasoning	CodeCode Available
Iso-Diffusion: Improving Diffusion Probabilistic Models Using the Isotropy of the Additive Gaussian Noise	Mar 25, 2024	DenoisingImage Generation	—Unverified
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation	Mar 25, 2024	Image GenerationInstruction Following	—Unverified
Multi-Scale Texture Loss for CT denoising with GANs	Mar 25, 2024	DenoisingImage Generation	CodeCode Available
R3CD: Scene Graph to Image Generation with Relation-aware Compositional Contrastive Control Diffusion	Mar 24, 2024	DenoisingImage Generation	—Unverified
Advanced Feature Manipulation for Enhanced Change Detection Leveraging Natural Language Models	Mar 23, 2024	Change DetectionImage Generation	—Unverified
Geometric Generative Models based on Morphological Equivariant PDEs and GANs	Mar 22, 2024	Image Generation	—Unverified
Generative Active Learning for Image Synthesis Personalization	Mar 22, 2024	Active LearningImage Generation	CodeCode Available
Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information	Mar 22, 2024	3D ReconstructionHallucination	—Unverified
MM-Diff: High-Fidelity Image Personalization via Multi-Modal Condition Integration	Mar 22, 2024	Image GenerationPersonalized Image Generation	—Unverified
Analysing Diffusion Segmentation for Medical Images	Mar 21, 2024	DenoisingImage Generation	—Unverified
QSMDiff: Unsupervised 3D Diffusion Models for Quantitative Susceptibility Mapping	Mar 21, 2024	DenoisingImage Denoising	—Unverified
Style-Extracting Diffusion Models for Semi-Supervised Histopathology Segmentation	Mar 21, 2024	Image GenerationSegmentation	—Unverified

Show:10 25 50

← PrevPage 79 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified