Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–375 of 6689 papers

Title	Date	Tasks	Status	Hype
Generative Multimodal Pretraining with Discrete Diffusion Timestep Tokens	Apr 20, 2025	AttributeImage Generation	—Unverified	0
Leveraging Generative AI Models to Explore Human Identity	Apr 19, 2025	Image Generation	—Unverified	0
Towards Explainable Fake Image Detection with Multi-Modal Large Language Models	Apr 19, 2025	Fake Image DetectionImage Generation	CodeCode Available	0
Cross-attention for State-based model RWKV-7	Apr 19, 2025	cross-modal alignmentImage Generation	—Unverified	0
PRISM: A Unified Framework for Photorealistic Reconstruction and Intrinsic Scene Modeling	Apr 19, 2025	Conditional Image GenerationImage Generation	—Unverified	0
Text-Audio-Visual-conditioned Diffusion Model for Video Saliency Prediction	Apr 19, 2025	DenoisingImage Generation	—Unverified	0
Towards NSFW-Free Text-to-Image Generation via Safety-Constraint Direct Preference Optimization	Apr 19, 2025	Contrastive LearningImage Generation	—Unverified	0
Learning Joint ID-Textual Representation for ID-Preserving Image Synthesis	Apr 19, 2025	Image Generation	—Unverified	0
Exploring Language Patterns of Prompts in Text-to-Image Generation and Their Impact on Visual Diversity	Apr 19, 2025	DiversityImage Generation	—Unverified	0
Point-Driven Interactive Text and Image Layer Editing Using Diffusion Models	Apr 18, 2025	Image Generation	—Unverified	0
Entropy Rectifying Guidance for Diffusion and Flow Models	Apr 18, 2025	DiversityImage Generation	—Unverified	0
MLEP: Multi-granularity Local Entropy Patterns for Universal AI-generated Image Detection	Apr 18, 2025	Image GenerationMisinformation	—Unverified	0
SupResDiffGAN a new approach for the Super-Resolution task	Apr 18, 2025	Image GenerationSuper-Resolution	CodeCode Available	1
U-Shape Mamba: State Space Model for faster diffusion	Apr 18, 2025	DecoderImage Generation	CodeCode Available	1
Early Timestep Zero-Shot Candidate Selection for Instruction-Guided Image Editing	Apr 18, 2025	Image Generation	—Unverified	0
Collective Learning Mechanism based Optimal Transport Generative Adversarial Network for Non-parallel Voice Conversion	Apr 18, 2025	Generative Adversarial NetworkImage Generation	—Unverified	0
POET: Supporting Prompting Creativity and Personalization with Automated Expansion of Text-to-Image Generation	Apr 18, 2025	Image GenerationText to Image Generation	—Unverified	0
Personalized Text-to-Image Generation with Auto-Regressive Models	Apr 17, 2025	Image GenerationPersonalized Image Generation	CodeCode Available	1
SMPL-GPTexture: Dual-View 3D Human Texture Estimation using Text-to-Image Generation Models	Apr 17, 2025	Human Mesh RecoveryImage Generation	—Unverified	0
Privacy Protection Against Personalized Text-to-Image Synthesis via Cross-image Consistency Constraints	Apr 17, 2025	Image Generation	—Unverified	0
ForgetMe: Evaluating Selective Forgetting in Generative Models	Apr 17, 2025	Image GenerationPrivacy Preserving	—Unverified	0
Science-T2I: Addressing Scientific Illusions in Image Synthesis	Apr 17, 2025	Image Generation	—Unverified	0
ArtistAuditor: Auditing Artist Style Pirate in Text-to-Image Generation Models	Apr 17, 2025	Image GenerationText to Image Generation	CodeCode Available	0
Enhancing Person-to-Person Virtual Try-On with Multi-Garment Virtual Try-Off	Apr 17, 2025	Garment ReconstructionImage Generation	CodeCode Available	2
HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation	Apr 17, 2025	3D GenerationImage Generation	—Unverified	0

Show:10 25 50

← PrevPage 15 of 268Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified