Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 6689 papers

Title	Date	Tasks	Status	Hype
Conditional Diffusion Models for Semantic 3D Brain MRI Synthesis	May 29, 2023	Data AugmentationImage Generation	CodeCode Available	2
Compressed Image Generation with Denoising Diffusion Codebook Models	Feb 3, 2025	Conditional Image GenerationDenoising	CodeCode Available	2
Harmonizing Visual Representations for Unified Multimodal Understanding and Generation	Mar 27, 2025	Image GenerationQuantization	CodeCode Available	2
Guess What I Think: Streamlined EEG-to-Image Generation with Latent Diffusion Models	Sep 17, 2024	Brain Computer InterfaceEEG	CodeCode Available	2
ConceptExpress: Harnessing Diffusion Models for Single-image Unsupervised Concept Extraction	Jul 9, 2024	Image GenerationText to Image Generation	CodeCode Available	2
I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling	May 22, 2024	Image GenerationMamba	CodeCode Available	2
Interpreting the Latent Space of GANs for Semantic Face Editing	Jul 25, 2019	AttributeDisentanglement	CodeCode Available	2
Marrying Autoregressive Transformer and Diffusion with Multi-Reference Autoregression	Jun 11, 2025	Image Generation	CodeCode Available	2
CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching	Apr 4, 2024	AttributeImage Captioning	CodeCode Available	2
GlyphDraw: Seamlessly Rendering Text with Intricate Spatial Structures in Text-to-Image Generation	Mar 31, 2023	Image GenerationOptical Character Recognition (OCR)	CodeCode Available	2
GPT4Point: A Unified Framework for Point-Language Understanding and Generation	Dec 5, 2023	3D GenerationImage Generation	CodeCode Available	2
Collaborative Neural Rendering using Anime Character Sheets	Jul 12, 2022	Image GenerationImage to 3D	CodeCode Available	2
CogView: Mastering Text-to-Image Generation via Transformers	May 26, 2021	Image GenerationSuper-Resolution	CodeCode Available	2
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models	Dec 20, 2021	DiversityImage Generation	CodeCode Available	2
GPT4Tools: Teaching Large Language Model to Use Tools via Self-instruction	May 30, 2023	Image GenerationInstruction Following	CodeCode Available	2
GeoSynth: Contextually-Aware High-Resolution Satellite Image Synthesis	Apr 9, 2024	Image GenerationZero-shot Generalization	CodeCode Available	2
CogView2: Faster and Better Text-to-Image Generation via Hierarchical Transformers	Apr 28, 2022	Image GenerationLanguage Modeling	CodeCode Available	2
Closed-Form Factorization of Latent Semantics in GANs	Jul 13, 2020	AttributeForm	CodeCode Available	2
Geometry-Complete Diffusion for 3D Molecule Generation and Optimization	Feb 8, 2023	3D Molecule GenerationDenoising	CodeCode Available	2
Gen-L-Video: Multi-Text to Long Video Generation via Temporal Co-Denoising	May 29, 2023	DenoisingImage Generation	CodeCode Available	2
GenStereo: Towards Open-World Generation of Stereo Images and Unsupervised Matching	Mar 17, 2025	Autonomous DrivingImage Generation	CodeCode Available	2
Compose and Conquer: Diffusion-Based 3D Depth Aware Composable Image Synthesis	Jan 17, 2024	DisentanglementImage Generation	CodeCode Available	2
Geodesic Diffusion Models for Medical Image-to-Image Generation	Mar 2, 2025	DenoisingImage Denoising	CodeCode Available	2
GIRAFFE: Representing Scenes as Compositional Generative Neural Feature Fields	Nov 24, 2020	Image GenerationNeural Rendering	CodeCode Available	2
Generative Enhancement for 3D Medical Images	Mar 19, 2024	counterfactualImage Generation	CodeCode Available	2
Generative Image as Action Models	Jul 10, 2024	Image GenerationRobot Manipulation	CodeCode Available	2
AnyText2: Visual Text Generation and Editing With Customizable Attributes	Nov 22, 2024	Image GenerationText Generation	CodeCode Available	2
Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient	Nov 26, 2024	GPUImage Generation	CodeCode Available	2
Generative Modeling by Estimating Gradients of the Data Distribution	Jul 12, 2019	Image GenerationImage Inpainting	CodeCode Available	2
Generative Adversarial Transformers	Mar 1, 2021	DisentanglementImage Generation	CodeCode Available	2
Generating Images with Multimodal Language Models	May 26, 2023	DecoderImage Generation	CodeCode Available	2
GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning	May 22, 2025	AttributeImage Generation	CodeCode Available	2
Generative AI for Character Animation: A Comprehensive Survey of Techniques, Applications, and Future Directions	Apr 27, 2025	Image GenerationMotion Synthesis	CodeCode Available	2
HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance	Apr 8, 2025	Image Generation	CodeCode Available	2
CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation	Feb 18, 2025	Image GenerationText to Image Generation	CodeCode Available	2
Generative Diffusion Models on Graphs: Methods and Applications	Feb 6, 2023	DenoisingGraph Generation	CodeCode Available	2
Generative Photography: Scene-Consistent Camera Control for Realistic Text-to-Image Synthesis	Dec 3, 2024	Image Generation	CodeCode Available	2
Gaussian Mixture Flow Matching Models	Apr 7, 2025	DenoisingImage Generation	CodeCode Available	2
GAUDI: A Neural Architect for Immersive 3D Scene Generation	Jul 27, 2022	Image GenerationScene Generation	CodeCode Available	2
Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition	Feb 23, 2024	Image GenerationPersonalized Image Generation	CodeCode Available	2
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization	Jun 24, 2024	Consistent Character GenerationImage Generation	CodeCode Available	2
CharaConsist: Fine-Grained Consistent Character Generation	Jul 15, 2025	Consistent Character GenerationImage Generation	CodeCode Available	2
Character-Aware Models Improve Visual Text Rendering	Dec 20, 2022	Image Generation	CodeCode Available	2
Conditional Image Synthesis with Diffusion Models: A Survey	Sep 28, 2024	DenoisingDiversity	CodeCode Available	2
GenAI Arena: An Open Evaluation Platform for Generative Models	Jun 6, 2024	Image GenerationInstruction Following	CodeCode Available	2
GAN Compression: Efficient Architectures for Interactive Conditional GANs	Mar 19, 2020	Image GenerationNeural Architecture Search	CodeCode Available	2
Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text-to-Image Synthesis	Jun 15, 2023	Image GenerationPreference Mapping	CodeCode Available	2
HumanRefiner: Benchmarking Abnormal Human Generation and Refining with Coarse-to-fine Pose-Reversible Guidance	Jul 9, 2024	BenchmarkingConditional Image Generation	CodeCode Available	2
GALIP: Generative Adversarial CLIPs for Text-to-Image Synthesis	Jan 30, 2023	Image GenerationScene Understanding	CodeCode Available	2
GAN Prior Embedded Network for Blind Face Restoration in the Wild	May 13, 2021	Blind Face RestorationDecoder	CodeCode Available	2

Show:10 25 50

← PrevPage 8 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified