Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4750 of 6689 papers

Title	Date	Tasks	Status
Soft Diffusion: Score Matching for General Corruptions	Sep 12, 2022	DenoisingImage Generation	—Unverified
Soft-Gated Warping-GAN for Pose-Guided Person Image Synthesis	Oct 27, 2018	Generative Adversarial NetworkImage Generation	—Unverified
Vid2Actor: Free-viewpoint Animatable Person Synthesis from Video in the Wild	Dec 23, 2020	Image GenerationImage-to-Image Translation	—Unverified
Advancements in Data Processing and Calibration for the Hyperspectral Imaging Satellite (HySIS)	Nov 1, 2024	Earth ObservationImage Generation	—Unverified
Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion Models	Sep 25, 2023	DenoisingImage Generation	—Unverified
ADT: Tuning Diffusion Models with Adversarial Supervision	Apr 15, 2025	DenoisingImage Generation	—Unverified
SoK: Can Synthetic Images Replace Real Data? A Survey of Utility and Privacy of Synthetic Image Generation	Jun 24, 2025	Image GenerationPrivacy Preserving	—Unverified
SoK: Privacy-Preserving Data Synthesis	Jul 5, 2023	Image GenerationPrivacy Preserving	—Unverified
Solving Inverse Problems with FLAIR	Jun 3, 2025	Image GenerationText to Image Generation	—Unverified
SonarSplat: Novel View Synthesis of Imaging Sonar via Gaussian Splatting	Mar 31, 2025	3D ReconstructionImage Generation	—Unverified
SonicDiffusion: Audio-Driven Image Generation and Editing with Pretrained Diffusion Models	May 1, 2024	Image GenerationText to Image Generation	—Unverified
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation	Mar 8, 2024	ArticlesHallucination	—Unverified
SounDiT: Geo-Contextual Soundscape-to-Landscape Generation	May 19, 2025	Image Generation	—Unverified
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing	Jun 14, 2023	Image GenerationVideo Editing	—Unverified
SOWing Information: Cultivating Contextual Coherence with MLLMs in Image Generation	Nov 28, 2024	DenoisingImage Generation	—Unverified
Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling	May 20, 2025	3D Generation3D Reconstruction	—Unverified
SPARKE: Scalable Prompt-Aware Diversity Guidance in Diffusion Models via RKE Score	Jun 11, 2025	DiversityImage Generation	—Unverified
SparseFusion: Distilling View-conditioned Diffusion for 3D Reconstruction	Dec 1, 2022	3D ReconstructionImage Generation	—Unverified
Shackled Dancing: A Bit-Locked Diffusion Algorithm for Lossless and Controllable Image Steganography	May 16, 2025	Image GenerationImage Steganography	—Unverified
Sparse Repellency for Shielded Generation in Text-to-image Diffusion Models	Oct 8, 2024	DiversityFairness	—Unverified
SpaText: Spatio-Textual Representation for Controllable Image Generation	Nov 25, 2022	Image GenerationText to Image Generation	—Unverified
Spatial-Aware Latent Initialization for Controllable Image Generation	Jan 29, 2024	DenoisingImage Generation	—Unverified
Spatial Functa: Scaling Functa to ImageNet Classification and Generation	Feb 6, 2023	ClassificationImage Generation	—Unverified
Spatial Fusion GAN for Image Synthesis	Dec 14, 2018	Image Generation	—Unverified
Spatial Latent Representations in Generative Adversarial Networks for Image Generation	Mar 25, 2023	AttributeImage Generation	—Unverified
Spatially Multi-conditional Image Generation	Mar 25, 2022	Conditional Image GenerationImage Generation	—Unverified
Spatial Steerability of GANs via Self-Supervision from Discriminator	Jan 20, 2023	Image GenerationInductive Bias	—Unverified
Spatial Transport Optimization by Repositioning Attention Map for Training-Free Text-to-Image Synthesis	Mar 28, 2025	DenoisingImage Generation	—Unverified
SPDiffusion: Semantic Protection Diffusion for Multi-concept Text-to-image Generation	Sep 2, 2024	AttributeImage Generation	—Unverified
VideoControlNet: A Motion-Guided Video-to-Video Translation Framework by Using Diffusion Model with ControlNet	Jul 26, 2023	Image Generation	—Unverified
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning	Sep 26, 2023	Image GenerationVideo Generation	—Unverified
Spectral Image Tokenizer	Dec 12, 2024	Image Generation	—Unverified
VideoDPO: Omni-Preference Alignment for Video Diffusion Generation	Dec 18, 2024	Image GenerationText-to-Video Generation	—Unverified
Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step	Oct 4, 2024	Image Generation	—Unverified
Character Generation through Self-Supervised Vectorization	Aug 3, 2022	Image Generation	—Unverified
Zoom-In-to-Check: Boosting Video Interpolation via Instance-level Discrimination	Dec 4, 2018	Image Generationobject-detection	—Unverified
ChatAnything: Facetime Chat with LLM-Enhanced Personas	Nov 12, 2023	Image GenerationIn-Context Learning	—Unverified
ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting	Nov 26, 2024	Image GenerationText to Image Generation	—Unverified
VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation	Sep 1, 2023	DecoderImage Generation	—Unverified
ChatPainter: Improving Text to Image Generation using Dialogue	Feb 22, 2018	Image GenerationText to Image Generation	—Unverified
CGOF++: Controllable 3D Face Synthesis with Conditional Generative Occupancy Fields	Nov 23, 2022	Face GenerationImage Generation	—Unverified
ChatScratch: An AI-Augmented System Toward Autonomous Visual Programming Learning for Children Aged 6-12	Feb 7, 2024	Image Generation	—Unverified
Cheap-fake Detection with LLM using Prompt Engineering	Jun 5, 2023	Image CaptioningImage Generation	—Unverified
Speech Fusion to Face: Bridging the Gap Between Human's Vocal Characteristics and Facial Imaging	Jun 10, 2020	Image Generation	—Unverified
Check, Locate, Rectify: A Training-Free Layout Calibration System for Text-to-Image Generation	Nov 27, 2023	Image GenerationText to Image Generation	—Unverified
Check Locate Rectify: A Training-Free Layout Calibration System for Text-to-Image Generation	Jan 1, 2024	Image GenerationText to Image Generation	—Unverified
Chest-Diffusion: A Light-Weight Text-to-Image Model for Report-to-CXR Generation	Jun 30, 2024	DenoisingImage Generation	—Unverified
Chili Pepper Disease Diagnosis via Image Reconstruction Using GrabCut and Generative Adversarial Serial Autoencoder	Jun 21, 2023	Anomaly DetectionImage Generation	—Unverified
SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models	Dec 13, 2023	Image Generation	—Unverified
Chinese Typeface Transformation with Hierarchical Adversarial Network	Nov 17, 2017	DecoderImage Generation	—Unverified

Show:10 25 50

← PrevPage 95 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified