Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–4000 of 6689 papers

Title	Date	Tasks	Status
Safeguarding Medical Image Segmentation Datasets against Unauthorized Training via Contour- and Texture-Aware Perturbations	Mar 21, 2024	image-classificationImage Classification	—Unverified
ReGround: Improving Textual and Spatial Grounding at No Cost	Mar 20, 2024	Image Generation	CodeCode Available
Deep Conditional HDRI: Inverse Tone Mapping via Dual Encoder-Decoder Conditioning Method	Mar 20, 2024	DecoderImage Generation	—Unverified
S2DM: Sector-Shaped Diffusion Models for Video Generation	Mar 20, 2024	Image GenerationOptical Flow Estimation	—Unverified
IIDM: Image-to-Image Diffusion Model for Semantic Image Synthesis	Mar 20, 2024	DenoisingImage Denoising	CodeCode Available
Deepfake Detection without Deepfakes: Generalization via Synthetic Frequency Patterns Injection	Mar 20, 2024	DeepFake DetectionFace Swapping	CodeCode Available
BlendScape: Enabling End-User Customization of Video-Conferencing Environments through Generative AI	Mar 20, 2024	Image Generationmultimodal interaction	—Unverified
TiBiX: Leveraging Temporal Information for Bidirectional X-ray and Report Generation	Mar 20, 2024	Image Generation	CodeCode Available
Step-Calibrated Diffusion for Biomedical Optical Image Restoration	Mar 20, 2024	DiagnosticImage Generation	CodeCode Available
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception	Mar 20, 2024	AttributeData Augmentation	—Unverified
Enhancing Fingerprint Image Synthesis with GANs, Diffusion Models, and Style Transfer Techniques	Mar 20, 2024	DiversityImage Generation	—Unverified
IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models	Mar 20, 2024	DiversityImage Generation	—Unverified
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation	Mar 20, 2024	Image GenerationText to Image Generation	—Unverified
Total Disentanglement of Font Images into Style and Character Class Features	Mar 19, 2024	DisentanglementFont Recognition	—Unverified
Ultra-High-Resolution Image Synthesis with Pyramid Diffusion Model	Mar 19, 2024	2kImage Generation	—Unverified
Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties	Mar 19, 2024	Image GenerationSemantic Segmentation	—Unverified
LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model	Mar 18, 2024	Image GenerationStyle Transfer	—Unverified
Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory	Mar 18, 2024	Image Generationreinforcement-learning	—Unverified
Urban Scene Diffusion through Semantic Occupancy Map	Mar 18, 2024	Image GenerationScene Understanding	—Unverified
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation	Mar 18, 2024	Image GenerationPosition	CodeCode Available
HOIDiffusion: Generating Realistic 3D Hand-Object Interaction Data	Mar 18, 2024	6D Pose Estimation using RGBImage Generation	—Unverified
Synthetic Image Generation in Cyber Influence Operations: An Emergent Threat?	Mar 18, 2024	Image Generation	—Unverified
A Survey on Quality Metrics for Text-to-Image Generation	Mar 18, 2024	Image GenerationSSIM	—Unverified
A psychophysical evaluation of techniques for Mooney image generation	Mar 18, 2024	Image Generation	—Unverified
Enhancing GAN Performance through Neural Architecture Search and Tensor Decomposition	Mar 18, 2024	Image Generation	CodeCode Available
Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation	Mar 18, 2024	Image Generation	—Unverified
Infinite-ID: Identity-preserved Personalization via ID-semantics Decoupling Paradigm	Mar 18, 2024	Image GenerationText to Image Generation	—Unverified
Understanding Diffusion Models by Feynman's Path Integral	Mar 17, 2024	Image Generation	—Unverified
CGI-DM: Digital Copyright Authentication for Diffusion Models via Contrasting Gradient Inversion	Mar 17, 2024	Image Generation	CodeCode Available
Zippo: Zipping Color and Transparency Distributions into a Single Diffusion Model	Mar 17, 2024	Image Generation	—Unverified
Generative modeling of seismic data using score-based generative models	Mar 17, 2024	GeophysicsImage Generation	CodeCode Available
StainDiffuser: MultiTask Dual Diffusion Model for Virtual Staining	Mar 17, 2024	Cell SegmentationDiagnostic	—Unverified
Fast Personalized Text-to-Image Syntheses With Attention Injection	Mar 17, 2024	Image GenerationPersonalized Image Generation	—Unverified
GazeFusion: Saliency-Guided Image Generation	Mar 16, 2024	Image Generation	—Unverified
StableGarment: Garment-Centric Generation via Stable Diffusion	Mar 16, 2024	DenoisingImage Generation	—Unverified
Reward Guided Latent Consistency Distillation	Mar 16, 2024	Image Generation	—Unverified
Denoising Task Difficulty-based Curriculum for Training Diffusion Models	Mar 15, 2024	DenoisingImage Generation	—Unverified
SphereDiffusion: Spherical Geometry-Aware Distortion Resilient Diffusion Model	Mar 15, 2024	DenoisingDiversity	—Unverified
SemanticHuman-HD: High-Resolution Semantic Disentangled 3D Human Generation	Mar 15, 2024	3D-Aware Image SynthesisDisentanglement	—Unverified
LightIt: Illumination Modeling and Control for Diffusion Models	Mar 15, 2024	Image Generation	—Unverified
Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder	Mar 15, 2024	DecoderDenoising	—Unverified
Codebook Transfer with Part-of-Speech for Vector-Quantized Image Modeling	Mar 15, 2024	Image Generation	—Unverified
Mitigating Data Consistency Induced Discrepancy in Cascaded Diffusion Models for Sparse-view CT Reconstruction	Mar 14, 2024	Computational EfficiencyComputed Tomography (CT)	—Unverified
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering	Mar 14, 2024	Image GenerationText to Image Generation	—Unverified
SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis	Mar 14, 2024	Image Generation	—Unverified
Noise Dimension of GAN: An Image Compression Perspective	Mar 14, 2024	Image CompressionImage Generation	—Unverified
Mitigating attribute amplification in counterfactual image generation	Mar 14, 2024	Attributecounterfactual	—Unverified
Make Me Happier: Evoking Emotions Through Image Diffusion Models	Mar 13, 2024	Image Generation	—Unverified
Unveiling the Truth: Exploring Human Gaze Patterns in Fake Images	Mar 13, 2024	Fake Image DetectionImage Generation	CodeCode Available
Attack Deterministic Conditional Image Generative Models for Diverse and Controllable Generation	Mar 13, 2024	Adversarial AttackConditional Image Generation	—Unverified

Show:10 25 50

← PrevPage 80 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified