Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2150 of 6689 papers

Title	Date	Tasks	Status	Hype
Generative Adversarial Text to Image Synthesis	May 17, 2016	Adversarial Text	CodeCode Available	1
Semantic Style Transfer and Turning Two-Bit Doodles into Fine Artworks	Mar 5, 2016	Image GenerationSemantic Segmentation	CodeCode Available	1
Iterative Gaussianization: from ICA to Random Rotations	Jan 31, 2016	DenoisingImage Generation	CodeCode Available	1
Pixel Recurrent Neural Networks	Jan 25, 2016	Image Generation	CodeCode Available	1
Combining Markov Random Fields and Convolutional Neural Networks for Image Synthesis	Jan 18, 2016	Image GenerationTexture Synthesis	CodeCode Available	1
DRAW: A Recurrent Neural Network For Image Generation	Feb 16, 2015	FoveationImage Generation	CodeCode Available	1
MADE: Masked Autoencoder for Distribution Estimation	Feb 12, 2015	Density EstimationImage Generation	CodeCode Available	1
NICE: Non-linear Independent Components Estimation	Oct 30, 2014	Image Generation	CodeCode Available	1
Synthesizing Reality: Leveraging the Generative AI-Powered Platform Midjourney for Construction Worker Detection	Jul 17, 2025	DiversityImage Generation	—Unverified	0
FashionPose: Text to Pose to Relight Image Generation for Personalized Fashion Visualization	Jul 17, 2025	Image Generation	—Unverified	0
A Distributed Generative AI Approach for Heterogeneous Multi-Domain Environments under Data Sharing constraints	Jul 17, 2025	Federated LearningImage Generation	CodeCode Available	0
fastWDM3D: Fast and Accurate 3D Healthy Tissue Inpainting	Jul 17, 2025	3D InpaintingDenoising	CodeCode Available	0
Pixel Perfect MegaMed: A Megapixel-Scale Vision-Language Foundation Model for Generating High Resolution Medical Images	Jul 17, 2025	Data AugmentationImage Generation	—Unverified	0
FADE: Adversarial Concept Erasure in Flow Models	Jul 16, 2025	FairnessImage Generation	—Unverified	0
CATVis: Context-Aware Thought Visualization	Jul 15, 2025	cross-modal alignmentEEG	—Unverified	0
Implementing Adaptations for Vision AutoRegressive Model	Jul 15, 2025	Image Generationmodel	CodeCode Available	0
Latent Space Consistency for Sparse-View CT Reconstruction	Jul 15, 2025	Computed Tomography (CT)Contrastive Learning	—Unverified	0
MFGDiffusion: Mask-Guided Smoke Synthesis for Enhanced Forest Fire Detection	Jul 15, 2025	Fire DetectionImage Generation	CodeCode Available	0
Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation	Jul 11, 2025	Image GenerationImage Reconstruction	—Unverified	0
Evaluating Attribute Confusion in Fashion Text-to-Image Generation	Jul 9, 2025	Attributecross-modal alignment	—Unverified	0
Model-free Optical Processors using In Situ Reinforcement Learning with Proximal Policy Optimization	Jul 8, 2025	image-classificationImage Classification	—Unverified	0
AdaptaGen: Domain-Specific Image Generation through Hierarchical Semantic Optimization Framework	Jul 8, 2025	DiversityImage Generation	—Unverified	0
TextPixs: Glyph-Conditioned Diffusion with Character-Aware Attention and OCR-Guided Supervision	Jul 8, 2025	Image GenerationOptical Character Recognition (OCR)	—Unverified	0
Trojan Horse Prompting: Jailbreaking Conversational Multimodal Models by Forging Assistant Message	Jul 7, 2025	Image GenerationSafety Alignment	—Unverified	0
Estimating Object Physical Properties from RGB-D Vision and Depth Robot Sensors Using Deep Learning	Jul 7, 2025	Image Generation	CodeCode Available	0
LoomNet: Enhancing Multi-View Image Generation via Latent Space Weaving	Jul 7, 2025	Image GenerationSurface Reconstruction	—Unverified	0
DC-AR: Efficient Masked Autoregressive Image Generation with Deep Compression Hybrid Tokenizer	Jul 7, 2025	Computational EfficiencyImage Generation	—Unverified	0
CorrDetail: Visual Detail Enhanced Self-Correction for Face Forgery Detection	Jul 7, 2025	Face SwappingImage Generation	—Unverified	0
AI-Driven Cytomorphology Image Synthesis for Medical Diagnostics	Jul 7, 2025	Image GenerationMedical Diagnosis	CodeCode Available	0
A Training-Free Style-Personalization via Scale-wise Autoregressive Model	Jul 6, 2025	Image GenerationPersonalized Image Generation	—Unverified	0
Hita: Holistic Tokenizer for Autoregressive Image Generation	Jul 3, 2025	Image GenerationStyle Transfer	CodeCode Available	0
UniMC: Taming Diffusion Transformer for Unified Keypoint-Guided Multi-Class Image Generation	Jul 3, 2025	Image Generation	—Unverified	0
Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis	Jul 2, 2025	Density EstimationImage Generation	—Unverified	0
Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation	Jul 2, 2025	Image GenerationPrediction	—Unverified	0
UniGlyph: Unified Segmentation-Conditioned Diffusion for Precise Visual Text Synthesis	Jul 1, 2025	Image GenerationText to Image Generation	—Unverified	0
Process-aware and high-fidelity microstructure generation using stable diffusion	Jul 1, 2025	Image GenerationSemantic Segmentation	—Unverified	0
Prompt Mechanisms in Medical Imaging: A Comprehensive Survey	Jun 28, 2025	Feature EngineeringImage Generation	—Unverified	0
GenFlow: Interactive Modular System for Image Generation	Jun 26, 2025	Image Generation	—Unverified	0
Instella-T2I: Pushing the Limits of 1D Discrete Latent Space Image Generation	Jun 26, 2025	GPUImage Generation	—Unverified	0
Improving Diffusion-Based Image Editing Faithfulness via Guidance and Scheduling	Jun 26, 2025	Image GenerationScheduling	—Unverified	0
ODE_t (ODE_l ): Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling	Jun 26, 2025	Image Generation	CodeCode Available	0
BitMark for Infinity: Watermarking Bitwise Autoregressive Image Generative Models	Jun 26, 2025	Image Generation	—Unverified	0
HybridQ: Hybrid Classical-Quantum Generative Adversarial Network for Skin Disease Image Generation	Jun 26, 2025	Data AugmentationGenerative Adversarial Network	—Unverified	0
Rethink Sparse Signals for Pose-guided Text-to-image Generation	Jun 26, 2025	Image GenerationPose-Guided Image Generation	CodeCode Available	0
EAR: Erasing Concepts from Unified Autoregressive Models	Jun 25, 2025	Image Generation	CodeCode Available	0
Diffusion Tree Sampling: Scalable inference-time alignment of diffusion models	Jun 25, 2025	Image GenerationText to Image Generation	—Unverified	0
MultiHuman-Testbench: Benchmarking Image Generation for Multiple Humans	Jun 25, 2025	Action DetectionBenchmarking	—Unverified	0
Med-Art: Diffusion Transformer for 2D Medical Text-to-Image Generation	Jun 25, 2025	Image GenerationMedical Image Generation	—Unverified	0
3DGH: 3D Head Generation with Composable Hair and Face	Jun 25, 2025	Image Generation	—Unverified	0
Video Perception Models for 3D Scene Synthesis	Jun 25, 2025	3D ReconstructionImage Generation	—Unverified	0

Show:10 25 50

← PrevPage 43 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified