Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6051–6100 of 6689 papers

Title	Date	Tasks	Status
PopAlign: Population-Level Alignment for Fair Text-to-Image Generation	Jun 28, 2024	Image GenerationText to Image Generation	CodeCode Available
Invisible Backdoor Triggers in Image Editing Model via Deep Watermarking	Jun 5, 2025	Backdoor AttackImage Generation	CodeCode Available
RPGAN: GANs Interpretability via Random Routing	Dec 23, 2019	Generative Adversarial NetworkImage Generation	CodeCode Available
Beta-Sigma VAE: Separating beta and decoder variance in Gaussian variational autoencoder	Sep 14, 2024	DecoderImage Generation	CodeCode Available
A Survey on fMRI-based Brain Decoding for Reconstructing Multimodal Stimuli	Mar 20, 2025	Brain DecodingImage Generation	CodeCode Available
RPGAN: random paths as a latent space for GAN interpretability	Sep 25, 2019	Generative Adversarial NetworkImage Generation	CodeCode Available
A Patch-Based Algorithm for Diverse and High Fidelity Single Image Generation	Oct 16, 2022	DiversityImage Generation	CodeCode Available
CusConcept: Customized Visual Concept Decomposition with Diffusion Models	Oct 1, 2024	Image GenerationText to Image Generation	CodeCode Available
A Conditional Denoising Diffusion Probabilistic Model for Radio Interferometric Image Reconstruction	May 16, 2023	AstronomyDenoising	CodeCode Available
SSPP-DAN: Deep Domain Adaptation Network for Face Recognition with Single Sample Per Person	Feb 14, 2017	Domain AdaptationFace Model	CodeCode Available
SynthText3D: Synthesizing Scene Text Images from 3D Virtual Worlds	Jul 13, 2019	Image GenerationScene Text Detection	CodeCode Available
Discriminator Rejection Sampling	Oct 16, 2018	Image Generation	CodeCode Available
Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models	Apr 1, 2025	Image Generation	CodeCode Available
RusCode: Russian Cultural Code Benchmark for Text-to-Image Generation	Feb 11, 2025	Image GenerationText to Image Generation	CodeCode Available
Structured Uncertainty in the Observation Space of Variational Autoencoders	May 25, 2022	DecoderImage Generation	CodeCode Available
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation	May 24, 2023	Image Generation	CodeCode Available
Multi-Granularity Denoising and Bidirectional Alignment for Weakly Supervised Semantic Segmentation	May 9, 2023	DenoisingImage Generation	CodeCode Available
Towards Label-Efficient Human Matting: A Simple Baseline for Weakly Semi-Supervised Trimap-Free Human Matting	Apr 1, 2024	Domain GeneralizationGPU	CodeCode Available
VersusDebias: Universal Zero-Shot Debiasing for Text-to-Image Models via SLM-Based Prompt Engineering and Generative Adversary	Jul 28, 2024	AttributeFairness	CodeCode Available
Zero-Shot Visual Concept Blending Without Text Guidance	Mar 27, 2025	Image GenerationStyle Transfer	CodeCode Available
KPE: Keypoint Pose Encoding for Transformer-based Image Generation	Mar 9, 2022	Image Generation	CodeCode Available
Pose Guided Person Image Generation	May 25, 2017	Gesture-to-Gesture TranslationImage Generation	CodeCode Available
Forensic Iris Image Synthesis	Dec 7, 2023	Image GenerationIris Recognition	CodeCode Available
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks	Feb 25, 2025	Image GenerationLayout Generation	CodeCode Available
Multilingual Text-to-Image Generation Magnifies Gender Stereotypes and Prompt Engineering May Not Help You	Jan 29, 2024	Image GenerationMultilingual Text-to-Image Generation	CodeCode Available
Efficient Gradient Flows in Sliced-Wasserstein Space	Oct 21, 2021	Bayesian InferenceImage Generation	CodeCode Available
Pose Invariant Person Re-Identification using Robust Pose-transformation GAN	Apr 11, 2021	ClusteringImage Generation	CodeCode Available
S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning	Sep 30, 2022	Data AugmentationImage Generation	CodeCode Available
Diffusion Models with Deterministic Normalizing Flow Priors	Sep 3, 2023	DenoisingImage Generation	CodeCode Available
Semantic Object Accuracy for Generative Text-to-Image Synthesis	Oct 29, 2019	Image CaptioningImage Generation	CodeCode Available
SWA-LDM: Toward Stealthy Watermarks for Latent Diffusion Models	Feb 14, 2025	Image Generation	CodeCode Available
BendVLM: Test-Time Debiasing of Vision-Language Embeddings	Nov 7, 2024	AttributeImage Generation	CodeCode Available
Iterative Neural Autoregressive Distribution Estimator NADE-k	Dec 1, 2014	Density EstimationImage Generation	CodeCode Available
Benchmarking Generative Latent Variable Models for Speech	Feb 22, 2022	BenchmarkingImage Generation	CodeCode Available
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers	Mar 19, 2025	Image GenerationQuantization	CodeCode Available
Iterative Neural Autoregressive Distribution Estimator (NADE-k)	Jun 5, 2014	Density EstimationImage Generation	CodeCode Available
FPQVAR: Floating Point Quantization for Visual Autoregressive Model with FPGA Hardware Co-design	May 22, 2025	GPUImage Generation	CodeCode Available
Multimodal Benchmarking and Recommendation of Text-to-Image Generation Models	May 6, 2025	BenchmarkingImage Generation	CodeCode Available
Stabilizing Training of Generative Adversarial Networks through Regularization	May 25, 2017	Image Generation	CodeCode Available
Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training	Dec 23, 2023	Image Generationreinforcement-learning	CodeCode Available
DivTrackee versus DynTracker: Promoting Diversity in Anti-Facial Recognition against Dynamic FR Strategy	Jan 11, 2025	DiversityImage Generation	CodeCode Available
IterInv: Iterative Inversion for Pixel-Level T2I Models	Oct 30, 2023	Image GenerationSuper-Resolution	CodeCode Available
Posterior Sampling Based on Gradient Flows of the MMD with Negative Distance Kernel	Oct 4, 2023	Conditional Image GenerationImage Generation	CodeCode Available
Towards More Accurate Personalized Image Generation: Addressing Overfitting and Evaluation Bias	Mar 9, 2025	Image GenerationPersonalized Image Generation	CodeCode Available
Safeguarding Text-to-Image Generation via Inference-Time Prompt-Noise Optimization	Dec 5, 2024	Image GenerationText to Image Generation	CodeCode Available
DiffLoss: unleashing diffusion model as constraint for training image restoration network	Jun 27, 2024	Image GenerationImage Restoration	CodeCode Available
Multi-modal Generation via Cross-Modal In-Context Learning	May 28, 2024	Image GenerationIn-Context Learning	CodeCode Available
BEGAN: Boundary Equilibrium Generative Adversarial Networks	Mar 31, 2017	DiversityImage Generation	CodeCode Available
Towards Improving the Generation Quality of Autoregressive Slot VAEs	Jun 3, 2022	Image GenerationObject	CodeCode Available
Connecting Vision and Language with Localized Narratives	Dec 6, 2019	FormImage Captioning	CodeCode Available

Show:10 25 50

← PrevPage 122 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified