Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3076–3100 of 6689 papers

Title	Date	Tasks	Status
JetFormer: An Autoregressive Generative Model of Raw Images and Text	Nov 29, 2024	DecoderImage Generation	—Unverified
QUOTA: Quantifying Objects with Text-to-Image Models for Any Domain	Nov 29, 2024	Domain GeneralizationImage Generation	—Unverified
Locally-Focused Face Representation for Sketch-to-Image Generation Using Noise-Induced Refinement	Nov 28, 2024	DecoderGenerative Adversarial Network	—Unverified
DreamBlend: Advancing Personalized Fine-tuning of Text-to-Image Diffusion Models	Nov 28, 2024	DiversityImage Generation	—Unverified
3D-WAG: Hierarchical Wavelet-Guided Autoregressive Generation for High-Fidelity 3D Shapes	Nov 28, 2024	3D Shape ModelingImage Generation	—Unverified
Improving Multi-Subject Consistency in Open-Domain Image Generation with Isolation and Reposition Attention	Nov 28, 2024	Image Generation	—Unverified
SOWing Information: Cultivating Contextual Coherence with MLLMs in Image Generation	Nov 28, 2024	DenoisingImage Generation	—Unverified
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects	Nov 28, 2024	Image Generation	—Unverified
Diffusion Self-Distillation for Zero-Shot Customized Image Generation	Nov 27, 2024	Image GenerationLanguage Modeling	—Unverified
Diffusion Autoencoders for Few-shot Image Generation in Hyperbolic Space	Nov 27, 2024	DiversityImage Generation	—Unverified
Type-R: Automatically Retouching Typos for Text-to-Image Generation	Nov 27, 2024	Image GenerationText to Image Generation	—Unverified
PersonaCraft: Personalized Full-Body Image Synthesis for Multiple Identities from Single References Using 3D-Model-Conditioned Diffusion	Nov 27, 2024	Image GenerationPersonalized Image Generation	—Unverified
Steering Rectified Flow Models in the Vector Field for Controlled Image Generation	Nov 27, 2024	DenoisingImage Generation	—Unverified
FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion	Nov 27, 2024	Image Generation	—Unverified
FaithDiff: Unleashing Diffusion Priors for Faithful Image Super-resolution	Nov 27, 2024	Image GenerationImage Super-Resolution	—Unverified
Exploring Visual Vulnerabilities via Multi-Loss Adversarial Search for Jailbreaking Vision-Language Models	Nov 27, 2024	Image GenerationSafety Alignment	—Unverified
Prediction with Action: Visual Policy Learning via Joint Denoising Process	Nov 27, 2024	DenoisingImage Generation	—Unverified
Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds	Nov 27, 2024	Image GenerationText to Image Generation	—Unverified
Reward Incremental Learning in Text-to-Image Generation	Nov 26, 2024	DenoisingImage Generation	—Unverified
DreamCache: Finetuning-Free Lightweight Personalized Image Generation via Feature Caching	Nov 26, 2024	Image GenerationPersonalized Image Generation	—Unverified
ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting	Nov 26, 2024	Image GenerationText to Image Generation	—Unverified
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available
Image Generation with Supervised Selection Based on Multimodal Features for Semantic Communications	Nov 26, 2024	Image GenerationImage Reconstruction	—Unverified
An Ensemble Approach for Brain Tumor Segmentation and Synthesis	Nov 26, 2024	Brain Tumor ClassificationBrain Tumor Segmentation	—Unverified
Interleaved Scene Graphs for Interleaved Text-and-Image Generation Assessment	Nov 26, 2024	Image GenerationStyle Transfer	—Unverified

Show:10 25 50

← PrevPage 124 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified