Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4001–4025 of 6689 papers

Title	Date	Tasks	Status
HAIFIT: Human-to-AI Fashion Image Translation	Mar 13, 2024	Image GenerationTranslation	CodeCode Available
VIGFace: Virtual Identity Generation for Privacy-Free Face Recognition	Mar 13, 2024	Data AugmentationFace Recognition	CodeCode Available
An Analysis of Human Alignment of Latent Diffusion Models	Mar 13, 2024	Image GenerationOdd One Out	—Unverified
Iterative Online Image Synthesis via Diffusion Model for Imbalanced Classification	Mar 13, 2024	Classificationimage-classification	—Unverified
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation	Mar 12, 2024	Image GenerationText to Image Generation	—Unverified
Block-wise LoRA: Revisiting Fine-grained LoRA for Effective Personalization and Stylization in Text-to-Image Generation	Mar 12, 2024	Image Generationparameter-efficient fine-tuning	—Unverified
Premonition: Using Generative Models to Preempt Future Data Changes in Continual Learning	Mar 12, 2024	Continual LearningFine-Grained Image Classification	CodeCode Available
BraSyn 2023 challenge: Missing MRI synthesis and the effect of different learning objectives	Mar 12, 2024	Brain Tumor SegmentationDeep Learning	—Unverified
Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings	Mar 12, 2024	Image CaptioningImage Generation	—Unverified
AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production	Mar 12, 2024	Image GenerationRAG	—Unverified
FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation	Mar 11, 2024	AttributeImage Generation	—Unverified
Advancing Text-Driven Chest X-Ray Generation with Policy-Based Reinforcement Learning	Mar 11, 2024	DenoisingDiagnostic	—Unverified
FFAD: A Novel Metric for Assessing Generated Time Series Data Utilizing Fourier Transform and Auto-encoder	Mar 11, 2024	Image GenerationTime Series	—Unverified
DivCon: Divide and Conquer for Progressive Text-to-Image Generation	Mar 11, 2024	Image GenerationLayout-to-Image Generation	—Unverified
Medical Image Synthesis via Fine-Grained Image-Text Alignment and Anatomy-Pathology Prompting	Mar 11, 2024	AnatomyDescriptive	—Unverified
Active Generation for Image Classification	Mar 11, 2024	Active LearningClassification	CodeCode Available
3D-aware Image Generation and Editing with Multi-modal Conditions	Mar 11, 2024	AttributeDisentanglement	—Unverified
Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation	Mar 10, 2024	Anomaly DetectionImage Generation	—Unverified
FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing	Mar 10, 2024	Image GenerationText-to-Video Editing	—Unverified
Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution	Mar 9, 2024	Image GenerationImage Super-Resolution	—Unverified
Diffusion Lens: Interpreting Text Encoders in Text-to-Image Pipelines	Mar 9, 2024	Image GenerationRetrieval	—Unverified
Fine-tuning a Multiple Instance Learning Feature Extractor with Masked Context Modelling and Knowledge Distillation	Mar 8, 2024	Image GenerationKnowledge Distillation	—Unverified
Denoising Autoregressive Representation Learning	Mar 8, 2024	DecoderDenoising	—Unverified
Spectrum Translation for Refinement of Image Generation (STIG) Based on Contrastive Learning and Spectral Filter Profile	Mar 8, 2024	Contrastive LearningFace Swapping	CodeCode Available
Evaluating Text-to-Image Generative Models: An Empirical Study on Human Image Synthesis	Mar 8, 2024	Defect DetectionFairness	CodeCode Available

Show:10 25 50

← PrevPage 161 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified