Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2700 of 6689 papers

Title	Date	Tasks	Status
Optimal Stochastic Trace Estimation in Generative Modeling	Feb 26, 2025	Image GenerationTime Series	—Unverified
AI-Instruments: Embodying Prompts as Instruments to Abstract & Reflect Graphical Interface Commands as General-Purpose Tools	Feb 26, 2025	Image Generation	—Unverified
Bayesian Optimization for Controlled Image Editing via LLMs	Feb 25, 2025	Bayesian OptimizationImage Generation	—Unverified
Robust Polyp Detection and Diagnosis through Compositional Prompt-Guided Diffusion Models	Feb 25, 2025	Data AugmentationImage Generation	—Unverified
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks	Feb 25, 2025	Image GenerationLayout Generation	CodeCode Available
ASurvey: Spatiotemporal Consistency in Video Generation	Feb 25, 2025	Image GenerationVideo Generation	—Unverified
LDGen: Enhancing Text-to-Image Synthesis via Large Language Model-Driven Language Representation	Feb 25, 2025	Image GenerationLanguage Modeling	—Unverified
Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence	Feb 24, 2025	Image GenerationRetrieval	—Unverified
A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis	Feb 24, 2025	Image Generation	—Unverified
SynthRAD2025 Grand Challenge dataset: generating synthetic CTs for radiotherapy	Feb 24, 2025	BenchmarkingImage Generation	—Unverified
Culture-TRIP: Culturally-Aware Text-to-Image Generation with Iterative Prompt Refinement	Feb 24, 2025	Image GenerationText to Image Generation	—Unverified
Autoregressive Image Generation Guided by Chains of Thought	Feb 24, 2025	Image GenerationLogical Reasoning	—Unverified
RELICT: A Replica Detection Framework for Medical Image Generation	Feb 24, 2025	Image GenerationMedical Image Generation	CodeCode Available
High-resolution Rainy Image Synthesis: Learning from Rendering	Feb 23, 2025	Image GenerationRain Removal	CodeCode Available
Unified Prompt Attack Against Text-to-Image Generation Models	Feb 23, 2025	Image GenerationText to Image Generation	—Unverified
Iterative Flow Matching -- Path Correction and Gradual Refinement for Enhanced Generative Modeling	Feb 23, 2025	Image Generation	—Unverified
DualNeRF: Text-Driven 3D Scene Editing via Dual-Field Representation	Feb 22, 2025	3D scene EditingDenoising	—Unverified
One-step Diffusion Models with f-Divergence Distribution Matching	Feb 21, 2025	Image GenerationText to Image Generation	—Unverified
Multi-Agent Multimodal Models for Multicultural Text to Image Generation	Feb 21, 2025	Image GenerationText to Image Generation	CodeCode Available
FlipConcept: Tuning-Free Multi-Concept Personalization for Text-to-Image Generation	Feb 21, 2025	AttributeImage Generation	—Unverified
Improving the Diffusability of Autoencoders	Feb 20, 2025	DecoderImage Generation	—Unverified
Generative Modeling of Individual Behavior at Scale	Feb 20, 2025	Image GenerationMulti-Task Learning	—Unverified
DC-ControlNet: Decoupling Inter- and Intra-Element Conditions in Image Generation with Diffusion Models	Feb 20, 2025	Conditional Image GenerationImage Generation	—Unverified
MagicGeo: Training-Free Text-Guided Geometric Diagram Generation	Feb 19, 2025	Image GenerationText to Image Generation	—Unverified
Flow-based generative models as iterative algorithms in probability space	Feb 19, 2025	Anomaly DetectionDensity Estimation	—Unverified
FlexTok: Resampling Images into 1D Token Sequences of Flexible Length	Feb 19, 2025	Image Generation	—Unverified
IP-Composer: Semantic Composition of Visual Concepts	Feb 19, 2025	Image GenerationSemantic Composition	—Unverified
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options	Feb 18, 2025	AutoMLDiversity	CodeCode Available
Spherical Dense Text-to-Image Synthesis	Feb 18, 2025	Image Generation	—Unverified
GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs	Feb 17, 2025	Image GenerationLanguage Modeling	—Unverified
A Survey on Bridging EEG Signals and Generative AI: From Image and Text to Beyond	Feb 17, 2025	Contrastive LearningEEG	—Unverified
Multi-Faceted Multimodal Monosemanticity	Feb 16, 2025	AttributeImage Generation	—Unverified
ManiTrend: Bridging Future Generation and Action Prediction with 3D Flow for Robotic Manipulation	Feb 14, 2025	Image GenerationPrediction	—Unverified
SWA-LDM: Toward Stealthy Watermarks for Latent Diffusion Models	Feb 14, 2025	Image Generation	CodeCode Available
Redistribute Ensemble Training for Mitigating Memorization in Diffusion Models	Feb 13, 2025	Image GenerationMemorization	CodeCode Available
Detecting Malicious Concepts Without Image Generation in AIGC	Feb 13, 2025	Image GenerationText to Image Generation	—Unverified
Designing a Conditional Prior Distribution for Flow-Based Generative Models	Feb 13, 2025	Image GenerationText to Image Generation	—Unverified
ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation	Feb 13, 2025	Image GenerationImage Retrieval	—Unverified
When the LM misunderstood the human chuckled: Analyzing garden path effects in humans and language models	Feb 13, 2025	Image GenerationSentence	—Unverified
EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling	Feb 13, 2025	Image Generation	—Unverified
PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation	Feb 12, 2025	Image GenerationText to Image Generation	—Unverified
Ultrasound Image Generation using Latent Diffusion Models	Feb 12, 2025	Image Generation	—Unverified
ID-Cloak: Crafting Identity-Specific Cloaks Against Personalized Text-to-Image Generation	Feb 12, 2025	Image GenerationText to Image Generation	—Unverified
Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation	Feb 12, 2025	DenoisingImage Generation	—Unverified
BCDDM: Branch-Corrected Denoising Diffusion Model for Black Hole Image Generation	Feb 12, 2025	DenoisingImage Generation	—Unverified
A Survey on Pre-Trained Diffusion Model Distillations	Feb 12, 2025	Image Generationmodel	—Unverified
Enhancing Diffusion Models Efficiency by Disentangling Total-Variance and Signal-to-Noise Ratio	Feb 12, 2025	Image Generation	CodeCode Available
Articulate That Object Part (ATOP): 3D Part Articulation from Text and Motion Personalization	Feb 11, 2025	Image GenerationMotion Generation	—Unverified
Classifier-Free Guidance: From High-Dimensional Analysis to Generalized Guidance Forms	Feb 11, 2025	DiversityImage Generation	—Unverified
CausalGeD: Blending Causality and Diffusion for Spatial Gene Expression Generation	Feb 11, 2025	AttributeImage Generation	—Unverified

Show:10 25 50

← PrevPage 54 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified