Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2450 of 6689 papers

Title	Date	Tasks	Status	Score
DiamondGAN: Unified Multi-Modal Generative Adversarial Networks for MRI Sequences Synthesis	Apr 29, 2019	Image Generation	CodeCode Available	5
BooVAE: Boosting Approach for Continual Learning of VAE	Aug 30, 2019	Continual LearningDiversity	CodeCode Available	5
ANNA: Abstractive Text-to-Image Synthesis with Filtered News Captions	Jan 5, 2023	ArticlesBenchmarking	CodeCode Available	5
DFU: scale-robust diffusion model for zero-shot super-resolution image generation	Nov 30, 2023	Image GenerationOperator learning	CodeCode Available	5
Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models	Oct 3, 2023	Image GenerationVisual Question Answering (VQA)	CodeCode Available	5
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation	May 24, 2023	Image Generation	CodeCode Available	5
Multi-Granularity Denoising and Bidirectional Alignment for Weakly Supervised Semantic Segmentation	May 9, 2023	DenoisingImage Generation	CodeCode Available	5
Devil is in Details: Locality-Aware 3D Abdominal CT Volume Generation for Self-Supervised Organ Segmentation	Sep 30, 2024	Image GenerationMedical Image Analysis	CodeCode Available	5
Multi class activity classification in videos using Motion History Image generation	Oct 13, 2024	Action ClassificationAction Recognition	CodeCode Available	5
Multi-Class Multi-Instance Count Conditioned Adversarial Image Generation	Mar 31, 2021	Generative Adversarial NetworkImage Generation	CodeCode Available	5
Boosting Text-To-Image Generation via Multilingual Prompting in Large Multimodal Models	Jan 13, 2025	Image GenerationIn-Context Learning	CodeCode Available	5
Multilingual Text-to-Image Generation Magnifies Gender Stereotypes and Prompt Engineering May Not Help You	Jan 29, 2024	Image GenerationMultilingual Text-to-Image Generation	CodeCode Available	5
Multi-Agent Multimodal Models for Multicultural Text to Image Generation	Feb 21, 2025	Image GenerationText to Image Generation	CodeCode Available	5
Detection Limits and Statistical Separability of Tree Ring Watermarks in Rectified Flow-based Text-to-Image Generation Models	Apr 4, 2025	Image GenerationText to Image Generation	CodeCode Available	5
Multi-attribute Pizza Generator: Cross-domain Attribute Control with Conditional StyleGAN	Oct 22, 2021	AttributeConditional Image Generation	CodeCode Available	5
Detecting Out-of-Context Image-Caption Pairs in News: A Counter-Intuitive Method	Aug 31, 2023	Fact CheckingImage Generation	CodeCode Available	5
Mukh-Oboyob: Stable Diffusion and BanglaBERT enhanced Bangla Text-to-Face Synthesis	Nov 1, 2023	Face GenerationImage Generation	CodeCode Available	5
Detecting Origin Attribution for Text-to-Image Diffusion Models	Mar 28, 2024	Fake Image DetectionImage Attribution	CodeCode Available	5
Boosting Imperceptibility of Stable Diffusion-based Adversarial Examples Generation with Momentum	Oct 17, 2024	Image GenerationSemantic Similarity	CodeCode Available	5
An Infinite Parade of Giraffes: Expressive Augmentation and Complexity Layers for Cartoon Drawing	Nov 8, 2018	Image GenerationSmall Data Image Classification	CodeCode Available	5
MPG: A Multi-ingredient Pizza Image Generator with Conditional StyleGANs	Dec 4, 2020	Conditional Image GenerationImage Generation	CodeCode Available	5
MRI Reconstruction Using Deep Energy-Based Model	Sep 7, 2021	Image Generationmodel	CodeCode Available	5
DRAN: Detailed Region-Adaptive Normalization for Conditional Image Synthesis	Sep 29, 2021	Facial Makeup TransferImage Generation	CodeCode Available	5
Motion Transfer-Driven intra-class data augmentation for Finger Vein Recognition	Dec 29, 2024	Data AugmentationFinger Vein Recognition	CodeCode Available	5
A Distributed Generative AI Approach for Heterogeneous Multi-Domain Environments under Data Sharing constraints	Jul 17, 2025	Federated LearningImage Generation	CodeCode Available	5
Detail-aware multi-view stereo network for depth estimation	Mar 31, 2025	Depth EstimationImage Generation	CodeCode Available	5
More comprehensive facial inversion for more effective expression recognition	Nov 24, 2022	Facial Expression RecognitionFacial Expression Recognition (FER)	CodeCode Available	5
Boosting Alignment for Post-Unlearning Text-to-Image Generative Models	Dec 9, 2024	Image GenerationMachine Unlearning	CodeCode Available	5
More Expressive Attention with Negative Weights	Nov 11, 2024	DecoderImage Generation	CodeCode Available	5
MontageGAN: Generation and Assembly of Multiple Components by GANs	May 31, 2022	Image Generation	CodeCode Available	5
DeSIGN: Design Inspiration from Generative Networks	Apr 3, 2018	Image GenerationRetrieval	CodeCode Available	5
DEsignBench: Exploring and Benchmarking DALL-E 3 for Imagining Visual Design	Oct 23, 2023	BenchmarkingImage Generation	CodeCode Available	5
MotionCom: Automatic and Motion-Aware Image Composition with LLM and Video Diffusion Prior	Sep 16, 2024	Image GenerationLanguage Modeling	CodeCode Available	5
MSG-GAN: Multi-Scale Gradients for Generative Adversarial Networks	Mar 14, 2019	Generative Adversarial NetworkImage Generation	CodeCode Available	5
Multimodal Benchmarking and Recommendation of Text-to-Image Generation Models	May 6, 2025	BenchmarkingImage Generation	CodeCode Available	5
Navigating the Synthetic Realm: Harnessing Diffusion-based Models for Laparoscopic Text-to-Image Generation	Dec 5, 2023	Decision MakingImage Generation	CodeCode Available	5
PixelNN: Example-based Image Synthesis	Aug 17, 2017	Image Generation	CodeCode Available	5
Design a Delicious Lunchbox in Style	May 22, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available	5
DeshuffleGAN: A Self-Supervised GAN to Improve Structure Learning	Jun 15, 2020	Image Generation	CodeCode Available	5
BLT: Balancing Long-Tailed Datasets with Adversarially-Perturbed Images	Oct 30, 2020	Data AugmentationImage Generation	CodeCode Available	5
Modeling Emotions and Ethics with Large Language Models	Apr 15, 2024	Decision MakingEthics	CodeCode Available	5
Model-based Cleaning of the QUILT-1M Pathology Dataset for Text-Conditional Image Synthesis	Apr 11, 2024	Image Generation	CodeCode Available	5
Mode Seeking Generative Adversarial Networks for Diverse Image Synthesis	Mar 13, 2019	DiversityImage Generation	CodeCode Available	5
MMaDA: Multimodal Large Diffusion Language Models	May 21, 2025	Image GenerationReinforcement Learning (RL)	CodeCode Available	5
Block Flow: Learning Straight Flow on Data Blocks	Jan 20, 2025	DiversityImage Generation	CodeCode Available	5
Mobile Edge Generation-Enabled Digital Twin: Architecture Design and Research Opportunities	Jul 3, 2024	Image Generation	CodeCode Available	5
Modular Generative Adversarial Networks	Apr 10, 2018	AttributeImage Generation	CodeCode Available	5
MixNMatch: Multifactor Disentanglement and Encoding for Conditional Image Generation	Nov 26, 2019	Conditional Image GenerationDisentanglement	CodeCode Available	5
Mixture-of-Subspaces in Low-Rank Adaptation	Jun 16, 2024	Common Sense ReasoningImage Generation	CodeCode Available	5
MISFIT-V: Misaligned Image Synthesis and Fusion using Information from Thermal and Visual	Sep 22, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available	5

Show:10 25 50

← PrevPage 49 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified