Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2600 of 6689 papers

Title	Date	Tasks	Status	Hype
Infinite-ID: Identity-preserved Personalization via ID-semantics Decoupling Paradigm	Mar 18, 2024	Image GenerationText to Image Generation	—Unverified	0
IDF-CR: Iterative Diffusion Process for Divide-and-Conquer Cloud Removal in Remote-sensing Images	Mar 18, 2024	Cloud RemovalImage Generation	CodeCode Available	1
HOIDiffusion: Generating Realistic 3D Hand-Object Interaction Data	Mar 18, 2024	6D Pose Estimation using RGBImage Generation	—Unverified	0
Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation	Mar 18, 2024	Image Generation	—Unverified	0
LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model	Mar 18, 2024	Image GenerationStyle Transfer	—Unverified	0
A Survey on Quality Metrics for Text-to-Image Generation	Mar 18, 2024	Image GenerationSSIM	—Unverified	0
Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory	Mar 18, 2024	Image Generationreinforcement-learning	—Unverified	0
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation	Mar 18, 2024	Image GenerationPosition	CodeCode Available	0
Binary Noise for Binary Tasks: Masked Bernoulli Diffusion for Unsupervised Anomaly Detection	Mar 18, 2024	Anomaly DetectionDenoising	CodeCode Available	1
CRS-Diff: Controllable Remote Sensing Image Generation with Diffusion Model	Mar 18, 2024	Image Generation	CodeCode Available	2
Urban Scene Diffusion through Semantic Occupancy Map	Mar 18, 2024	Image GenerationScene Understanding	—Unverified	0
Generative modeling of seismic data using score-based generative models	Mar 17, 2024	GeophysicsImage Generation	CodeCode Available	0
Source Prompt Disentangled Inversion for Boosting Image Editability with Diffusion Models	Mar 17, 2024	Image Generation	CodeCode Available	1
CGI-DM: Digital Copyright Authentication for Diffusion Models via Contrasting Gradient Inversion	Mar 17, 2024	Image Generation	CodeCode Available	0
Understanding Diffusion Models by Feynman's Path Integral	Mar 17, 2024	Image Generation	—Unverified	0
Fast Personalized Text-to-Image Syntheses With Attention Injection	Mar 17, 2024	Image GenerationPersonalized Image Generation	—Unverified	0
StainDiffuser: MultiTask Dual Diffusion Model for Virtual Staining	Mar 17, 2024	Cell SegmentationDiagnostic	—Unverified	0
Zippo: Zipping Color and Transparency Distributions into a Single Diffusion Model	Mar 17, 2024	Image Generation	—Unverified	0
GazeFusion: Saliency-Guided Image Generation	Mar 16, 2024	Image Generation	—Unverified	0
StableGarment: Garment-Centric Generation via Stable Diffusion	Mar 16, 2024	DenoisingImage Generation	—Unverified	0
OMG: Occlusion-friendly Personalized Multi-concept Generation in Diffusion Models	Mar 16, 2024	DenoisingImage Generation	CodeCode Available	4
Boosting Flow-based Generative Super-Resolution Models via Learned Prior	Mar 16, 2024	Image GenerationImage Super-Resolution	CodeCode Available	2
Reward Guided Latent Consistency Distillation	Mar 16, 2024	Image Generation	—Unverified	0
Giving a Hand to Diffusion Models: a Two-Stage Approach to Improving Conditional Human Image Generation	Mar 15, 2024	AnatomyImage Generation	CodeCode Available	1
LightIt: Illumination Modeling and Control for Diffusion Models	Mar 15, 2024	Image Generation	—Unverified	0
Codebook Transfer with Part-of-Speech for Vector-Quantized Image Modeling	Mar 15, 2024	Image Generation	—Unverified	0
Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder	Mar 15, 2024	DecoderDenoising	—Unverified	0
Denoising Task Difficulty-based Curriculum for Training Diffusion Models	Mar 15, 2024	DenoisingImage Generation	—Unverified	0
SphereDiffusion: Spherical Geometry-Aware Distortion Resilient Diffusion Model	Mar 15, 2024	DenoisingDiversity	—Unverified	0
Towards Unified Multi-Modal Personalization: Large Vision-Language Models for Generative Recommendation and Beyond	Mar 15, 2024	Explanation GenerationImage Generation	CodeCode Available	1
SemanticHuman-HD: High-Resolution Semantic Disentangled 3D Human Generation	Mar 15, 2024	3D-Aware Image SynthesisDisentanglement	—Unverified	0
Mitigating attribute amplification in counterfactual image generation	Mar 14, 2024	Attributecounterfactual	—Unverified	0
Mitigating Data Consistency Induced Discrepancy in Cascaded Diffusion Models for Sparse-view CT Reconstruction	Mar 14, 2024	Computational EfficiencyComputed Tomography (CT)	—Unverified	0
SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis	Mar 14, 2024	Image Generation	—Unverified	0
Counterfactual contrastive learning: robust representations via causal image synthesis	Mar 14, 2024	Contrastive Learningcounterfactual	CodeCode Available	1
Noise Dimension of GAN: An Image Compression Perspective	Mar 14, 2024	Image CompressionImage Generation	—Unverified	0
SemanticDraw: Towards Real-Time Interactive Content Creation from Image Diffusion Models	Mar 14, 2024	BlockingGPU	CodeCode Available	4
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering	Mar 14, 2024	Image GenerationText to Image Generation	—Unverified	0
Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing	Mar 14, 2024	Image Generationtext-guided-image-editing	CodeCode Available	1
Unveiling the Truth: Exploring Human Gaze Patterns in Fake Images	Mar 13, 2024	Fake Image DetectionImage Generation	CodeCode Available	0
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation	Mar 13, 2024	Image GenerationPrompt Engineering	CodeCode Available	7
HAIFIT: Human-to-AI Fashion Image Translation	Mar 13, 2024	Image GenerationTranslation	CodeCode Available	0
Iterative Online Image Synthesis via Diffusion Model for Imbalanced Classification	Mar 13, 2024	Classificationimage-classification	—Unverified	0
An Analysis of Human Alignment of Latent Diffusion Models	Mar 13, 2024	Image GenerationOdd One Out	—Unverified	0
VIGFace: Virtual Identity Generation for Privacy-Free Face Recognition	Mar 13, 2024	Data AugmentationFace Recognition	CodeCode Available	0
Make Me Happier: Evoking Emotions Through Image Diffusion Models	Mar 13, 2024	Image Generation	—Unverified	0
Attack Deterministic Conditional Image Generative Models for Diverse and Controllable Generation	Mar 13, 2024	Adversarial AttackConditional Image Generation	—Unverified	0
AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production	Mar 12, 2024	Image GenerationRAG	—Unverified	0
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation	Mar 12, 2024	Image GenerationText to Image Generation	—Unverified	0
Bridging Different Language Models and Generative Vision Models for Text-to-Image Generation	Mar 12, 2024	Image GenerationLanguage Modelling	CodeCode Available	5

Show:10 25 50

← PrevPage 52 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified