Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2275 of 6689 papers

Title	Date	Tasks	Status
CLoRA: A Contrastive Approach to Compose Multiple LoRA Models	Mar 28, 2024	Image Generation	—Unverified
DTGAN: Dual Attention Generative Adversarial Networks for Text-to-Image Generation	Nov 5, 2020	Generative Adversarial NetworkImage Generation	—Unverified
DT2I: Dense Text-to-Image Generation from Region Descriptions	Apr 5, 2022	Conditional Image GenerationImage Generation	—Unverified
Articulate That Object Part (ATOP): 3D Part Articulation from Text and Motion Personalization	Feb 11, 2025	Image GenerationMotion Generation	—Unverified
A Novel Evaluation Framework for Image2Text Generation	Aug 3, 2024	Image CaptioningImage Generation	—Unverified
DSRGAN: Explicitly Learning Disentangled Representation of Underlying Structure and Rendering for Image Generation without Tuple Supervision	Sep 30, 2019	Image Generation	—Unverified
DSE-GAN: Dynamic Semantic Evolution Generative Adversarial Network for Text-to-Image Generation	Sep 3, 2022	Generative Adversarial NetworkImage Generation	—Unverified
Opt-In Art: Learning Art Styles Only from Few Examples	Nov 29, 2024	Image GenerationText-to-Image Generation	—Unverified
CLIP Model for Images to Textual Prompts Based on Top-k Neighbors	Jan 18, 2024	Image Generationmultimodal generation	—Unverified
Edit360: 2D Image Edits to 3D Assets from Any Angle	Jun 12, 2025	Image Generation	—Unverified
DriveX: Omni Scene Modeling for Learning Generalizable World Knowledge in Autonomous Driving	May 25, 2025	Autonomous DrivingImage Generation	—Unverified
ATTIQA: Generalizable Image Quality Feature Extractor using Attribute-aware Pretraining	Jun 3, 2024	AttributeImage Enhancement	—Unverified
gCoRF: Generative Compositional Radiance Fields	Oct 31, 2022	Image Generation	—Unverified
Generate Subgoal Images before Act: Unlocking the Chain-of-Thought Reasoning in Diffusion Model for Robot Manipulation with Multimodal Prompts	Jan 1, 2024	Image GenerationInstruction Following	—Unverified
Dressing in the Wild by Watching Dance Videos	Mar 29, 2022	Image GenerationVirtual Try-on	—Unverified
DreamVideo: Composing Your Dream Videos with Customized Subject and Motion	Dec 7, 2023	Image GenerationVideo Generation	—Unverified
DreamTuner: Single Image is Enough for Subject-Driven Generation	Dec 21, 2023	Image GenerationText to Image Generation	—Unverified
DreamTime: An Improved Optimization Strategy for Diffusion-Guided 3D Generation	Jun 21, 2023	3D GenerationDiversity	—Unverified
DreamSync: Aligning Text-to-Image Generation with Image Understanding Feedback	Nov 29, 2023	Image GenerationQuestion Answering	—Unverified
DreamStyler: Paint by Style Inversion with Text-to-Image Diffusion Models	Sep 13, 2023	Image GenerationStyle Transfer	—Unverified
CLIPAG: Towards Generator-Free Text-to-Image Generation	Jun 29, 2023	image-classificationImage Classification	—Unverified
ArrowGAN : Learning to Generate Videos by Learning Arrow of Time	Jan 11, 2021	Conditional Image GenerationImage Generation	—Unverified
DreamSparse: Escaping from Plato's Cave with 2D Frozen Diffusion Model Given Sparse Views	Jun 6, 2023	Image Generation	—Unverified
DreamScape: 3D Scene Creation via Gaussian Splatting joint Correlation Modeling	Apr 14, 2024	global-optimizationImage Generation	—Unverified
CLIP2GAN: Towards Bridging Text with the Latent Space of GANs	Nov 28, 2022	AttributeImage Generation	—Unverified

Show:10 25 50

← PrevPage 91 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified