Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3751–3800 of 6689 papers

Title	Date	Tasks	Status
Learning Latent Space Hierarchical EBM Diffusion Models	May 22, 2024	Image Generation	—Unverified
Generalized Compressed Sensing for Image Reconstruction with Diffusion Probabilistic Models	May 22, 2024	compressed sensingDenoising	CodeCode Available
Computational Tradeoffs in Image Synthesis: Diffusion, Masked-Token, and Next-Token Prediction	May 21, 2024	Image GenerationPrediction	—Unverified
An Empirical Study and Analysis of Text-to-Image Generation Using Large Language Model-Powered Textual Representation	May 21, 2024	Image GenerationLanguage Modeling	CodeCode Available
Personalized Residuals for Concept-Driven Text-to-Image Generation	May 21, 2024	GPUImage Generation	—Unverified
CustomText: Customized Textual Image Generation using Diffusion Models	May 21, 2024	DecoderImage Generation	—Unverified
UPAM: Unified Prompt Attack in Text-to-Image Generation Models Against Both Textual Filters and Visual Checkers	May 18, 2024	Image GenerationText to Image Generation	—Unverified
TriLoRA: Integrating SVD for Advanced Style Personalization in Text-to-Image Generation	May 18, 2024	Image GenerationText to Image Generation	—Unverified
Improving face generation quality and prompt following with synthetic captions	May 17, 2024	Face GenerationImage Generation	—Unverified
Lean Attention: Hardware-Aware Scalable Attention Mechanism for the Decode-Phase of Transformers	May 17, 2024	Image GenerationText Generation	—Unverified
MediSyn: Text-Guided Diffusion Models for Broad Medical 2D and 3D Image Synthesis	May 16, 2024	Image Generation	—Unverified
KPNDepth: Depth Estimation of Lane Images under Complex Rainy Environment	May 16, 2024	Depth EstimationImage Generation	—Unverified
VirtualModel: Generating Object-ID-retentive Human-object Interaction Image by Diffusion Model for E-commerce Marketing	May 16, 2024	Human-Object Interaction DetectionImage Generation	—Unverified
VisioBlend: Sketch and Stroke-Guided Denoising Diffusion Probabilistic Model for Realistic Image Generation	May 15, 2024	DenoisingEfficient Diffusion Personalization	—Unverified
Global-Local Image Perceptual Score (GLIPS): Evaluating Photorealistic Quality of AI-Generated Images	May 15, 2024	Image GenerationMS-SSIM	—Unverified
DeCoDEx: Confounder Detector Guidance for Improved Diffusion-based Counterfactual Explanations	May 15, 2024	counterfactualImage Generation	CodeCode Available
Similarity and Quality Metrics for MR Image-To-Image Translation	May 14, 2024	Image GenerationImage-to-Image Translation	—Unverified
Compositional Text-to-Image Generation with Dense Blob Representations	May 14, 2024	Image GenerationIn-Context Learning	—Unverified
RATLIP: Generative Adversarial CLIP Text-to-Image Synthesis Based on Recurrent Affine Transformations	May 13, 2024	Image Generation	CodeCode Available
SAR Image Synthesis with Diffusion Models	May 13, 2024	DenoisingImage Generation	—Unverified
Training-free Subject-Enhanced Attention Guidance for Compositional Text-to-image Generation	May 11, 2024	AttributeImage Generation	—Unverified
Controllable Image Generation With Composed Parallel Token Prediction	May 10, 2024	Image GenerationPrediction	—Unverified
Deep MMD Gradient Flow without adversarial training	May 10, 2024	DenoisingImage Generation	—Unverified
Exploring Text-Guided Single Image Editing for Remote Sensing Images	May 9, 2024	Image Generation	CodeCode Available
An Inversion-based Measure of Memorization for Diffusion Models	May 9, 2024	Image GenerationMemorization	CodeCode Available
VM-DDPM: Vision Mamba Diffusion for Medical Image Synthesis	May 9, 2024	DecoderDiversity	—Unverified
A Survey on Personalized Content Synthesis with Diffusion Models	May 9, 2024	Face GenerationImage Generation	—Unverified
Discrepancy-based Diffusion Models for Lesion Detection in Brain MRI	May 8, 2024	Anomaly DetectionImage Generation	—Unverified
FlexEControl: Flexible and Efficient Multimodal Control for Text-to-Image Generation	May 8, 2024	Image GenerationText to Image Generation	—Unverified
Diffusion-HMC: Parameter Inference with Diffusion-model-driven Hamiltonian Monte Carlo	May 8, 2024	Image Generation	CodeCode Available
HAGAN: Hybrid Augmented Generative Adversarial Network for Medical Image Synthesis	May 8, 2024	Generative Adversarial NetworkImage Generation	—Unverified
Variational Schrödinger Diffusion Models	May 8, 2024	Image GenerationVariational Inference	—Unverified
Simple Drop-in LoRA Conditioning on Attention Layers Will Improve Your Diffusion Model	May 7, 2024	Image Generation	—Unverified
ResNCT: A Deep Learning Model for the Synthesis of Nephrographic Phase Images in CT Urography	May 7, 2024	Image GenerationSSIM	—Unverified
TexControl: Sketch-Based Two-Stage Fashion Image Generation Using Diffusion Model	May 7, 2024	Image Generation	—Unverified
Diffusion-driven GAN Inversion for Multi-Modal Face Image Generation	May 7, 2024	Image Generation	CodeCode Available
Generated Contents Enrichment	May 6, 2024	Image Generation	—Unverified
Data-Efficient Molecular Generation with Hierarchical Textual Inversion	May 5, 2024	Drug DiscoveryImage Generation	CodeCode Available
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified
Defect Image Sample Generation With Diffusion Prior for Steel Surface Defect Recognition	May 3, 2024	Image Generation	—Unverified
Functional Imaging Constrained Diffusion for Brain PET Synthesis from Structural MRI	May 3, 2024	Image Generation	CodeCode Available
Long Tail Image Generation Through Feature Space Augmentation and Iterated Learning	May 2, 2024	Image AugmentationImage Generation	CodeCode Available
Towards Inclusive Face Recognition Through Synthetic Ethnicity Alteration	May 2, 2024	DiversityFace Image Quality	—Unverified
Improving Subject-Driven Image Synthesis with Subject-Agnostic Guidance	May 2, 2024	Image Generation	—Unverified
RGBX: Image decomposition and synthesis using material- and lighting-aware diffusion models	May 1, 2024	Image GenerationInverse Rendering	—Unverified
Guided Conditional Diffusion Classifier (ConDiff) for Enhanced Prediction of Infection in Diabetic Foot Ulcers	May 1, 2024	DenoisingDiagnostic	—Unverified
UWAFA-GAN: Ultra-Wide-Angle Fluorescein Angiography Transformation via Multi-scale Generation and Registration Enhancement	May 1, 2024	DiagnosticGenerative Adversarial Network	CodeCode Available
Compressive Sensing Imaging Using Caustic Lens Mask Generated by Periodic Perturbation in a Ripple Tank	May 1, 2024	Compressive SensingImage Generation	—Unverified
SonicDiffusion: Audio-Driven Image Generation and Editing with Pretrained Diffusion Models	May 1, 2024	Image GenerationText to Image Generation	—Unverified
Streamlining Image Editing with Layered Diffusion Brushes	May 1, 2024	AttributeDenoising	—Unverified

Show:10 25 50

← PrevPage 76 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified