Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2325 of 6689 papers

Title	Date	Tasks	Status	Hype
Defect Image Sample Generation With Diffusion Prior for Steel Surface Defect Recognition	May 3, 2024	Image Generation	—Unverified	0
Multi-method Integration with Confidence-based Weighting for Zero-shot Image Classification	May 3, 2024	image-classificationImage Classification	—Unverified	0
Towards Inclusive Face Recognition Through Synthetic Ethnicity Alteration	May 2, 2024	DiversityFace Image Quality	—Unverified	0
Long Tail Image Generation Through Feature Space Augmentation and Iterated Learning	May 2, 2024	Image AugmentationImage Generation	CodeCode Available	0
Improving Subject-Driven Image Synthesis with Subject-Agnostic Guidance	May 2, 2024	Image Generation	—Unverified	0
Guided Conditional Diffusion Classifier (ConDiff) for Enhanced Prediction of Infection in Diabetic Foot Ulcers	May 1, 2024	DenoisingDiagnostic	—Unverified	0
SonicDiffusion: Audio-Driven Image Generation and Editing with Pretrained Diffusion Models	May 1, 2024	Image GenerationText to Image Generation	—Unverified	0
Compressive Sensing Imaging Using Caustic Lens Mask Generated by Periodic Perturbation in a Ripple Tank	May 1, 2024	Compressive SensingImage Generation	—Unverified	0
Streamlining Image Editing with Layered Diffusion Brushes	May 1, 2024	AttributeDenoising	—Unverified	0
UWAFA-GAN: Ultra-Wide-Angle Fluorescein Angiography Transformation via Multi-scale Generation and Registration Enhancement	May 1, 2024	DiagnosticGenerative Adversarial Network	CodeCode Available	0
RGBX: Image decomposition and synthesis using material- and lighting-aware diffusion models	May 1, 2024	Image GenerationInverse Rendering	—Unverified	0
InstantFamily: Masked Attention for Zero-shot Multi-ID Image Generation	Apr 30, 2024	Face RecognitionImage Generation	—Unverified	0
TwinDiffusion: Enhancing Coherence and Efficiency in Panoramic Image Generation with Diffusion Models	Apr 30, 2024	Image Generation	CodeCode Available	1
SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration	Apr 30, 2024	Image Generation	—Unverified	0
DOCCI: Descriptions of Connected and Contrasting Images	Apr 30, 2024	Image GenerationImage to text	—Unverified	0
NeRF-Insert: 3D Local Editing with Multimodal Control Signals	Apr 30, 2024	Image GenerationNeRF	—Unverified	0
G-Refine: A General Quality Refiner for Text-to-Image Generation	Apr 29, 2024	Image GenerationText to Image Generation	CodeCode Available	1
Anywhere: A Multi-Agent Framework for User-Guided, Reliable, and Diverse Foreground-Conditioned Image Generation	Apr 29, 2024	DiversityImage Generation	—Unverified	0
SIDBench: A Python Framework for Reliably Assessing Synthetic Image Detection Methods	Apr 29, 2024	BenchmarkingImage Generation	CodeCode Available	2
PKU-AIGIQA-4K: A Perceptual Quality Assessment Database for Both Text-to-Image and Image-to-Image AI-Generated Images	Apr 29, 2024	4kImage Generation	CodeCode Available	0
Hide and Seek: How Does Watermarking Impact Face Recognition?	Apr 29, 2024	Data AugmentationDecoder	—Unverified	0
A robust and scalable framework for hallucination detection in virtual tissue staining and digital pathology	Apr 29, 2024	HallucinationImage Generation	—Unverified	0
FlexiFilm: Long Video Generation with Flexible Conditions	Apr 29, 2024	Image GenerationVideo Generation	CodeCode Available	1
Learning Mixtures of Gaussians Using Diffusion Models	Apr 29, 2024	Image Generation	—Unverified	0
TheaterGen: Character Management with LLM for Consistent Multi-turn Image Generation	Apr 29, 2024	DenoisingImage Generation	CodeCode Available	2

Show:10 25 50

← PrevPage 93 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified