Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 6689 papers

Title	Date	Tasks	Status	Hype
Exploring Sparsity for Parameter Efficient Fine Tuning Using Wavelets	May 18, 2025	DiversityImage Generation	CodeCode Available	0
Few-Shot Concept Unlearning with Low Rank Adaptation	May 18, 2025	DenoisingImage Generation	—Unverified	0
Guiding Diffusion with Deep Geometric Moments: Balancing Fidelity and Variation	May 18, 2025	DiversityImage Generation	—Unverified	0
Context-Aware Autoregressive Models for Multi-Conditional Image Generation	May 18, 2025	Conditional Image GenerationImage Generation	—Unverified	0
FastCar: Cache Attentive Replay for Fast Auto-Regressive Video Generation on the Edge	May 17, 2025	Image GenerationScheduling	CodeCode Available	1
Measurement Score-Based Diffusion Model	May 17, 2025	Image Generationmodel	CodeCode Available	0
LoFT: LoRA-fused Training Dataset Generation with Few-shot Guidance	May 16, 2025	Dataset GenerationDiversity	CodeCode Available	0
PSDiffusion: Harmonized Multi-Layer Image Generation via Layout and Appearance Alignment	May 16, 2025	Image GenerationText to Image Generation	—Unverified	0
DRAGON: A Large-Scale Dataset of Realistic Images Generated by Diffusion Models	May 16, 2025	Image GenerationLarge Language Model	—Unverified	0
Diffusion-NPO: Negative Preference Optimization for Better Preference Aligned Generation of Diffusion Models	May 16, 2025	Image Generation	CodeCode Available	1
CompAlign: Improving Compositional Text-to-Image Generation with a Complex Benchmark and Fine-Grained Feedback	May 16, 2025	AttributeImage Generation	—Unverified	0
One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework	May 16, 2025	AttributeImage Generation	CodeCode Available	1
HSRMamba: Efficient Wavelet Stripe State Space Model for Hyperspectral Image Super-Resolution	May 16, 2025	Computational EfficiencyHyperspectral Image Super-Resolution	CodeCode Available	0
DDAE++: Enhancing Diffusion Models Towards Unified Generative and Discriminative Learning	May 16, 2025	DenoisingImage Generation	—Unverified	0
Generative Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges	May 16, 2025	Data AugmentationDiagnostic	—Unverified	0
Shackled Dancing: A Bit-Locked Diffusion Algorithm for Lossless and Controllable Image Steganography	May 16, 2025	Image GenerationImage Steganography	—Unverified	0
Exploring the Deep Fusion of Large Language Models and Diffusion Transformers for Text-to-Image Synthesis	May 15, 2025	Image GenerationText to Image Generation	CodeCode Available	2
IMAGE-ALCHEMY: Advancing subject fidelity in personalised text-to-image generation	May 15, 2025	Image GenerationText to Image Generation	—Unverified	0
End-to-End Vision Tokenizer Tuning	May 15, 2025	Image GenerationQuestion Answering	—Unverified	0
EnerVerse-AC: Envisioning Embodied Environments with Action Condition	May 14, 2025	Image GenerationImitation Learning	—Unverified	0
Don't Forget your Inverse DDIM for Image Editing	May 14, 2025	Image GenerationText to Image Generation	—Unverified	0
BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset	May 14, 2025	Image Generation	CodeCode Available	5
An Initial Exploration of Default Images in Text-to-Image Generation	May 14, 2025	Image GenerationPrompt Engineering	—Unverified	0
Mini Diffuser: Fast Multi-task Diffusion Policy Training Using Two-level Mini-batches	May 14, 2025	Action GenerationImage Generation	CodeCode Available	1
Skeleton-Guided Diffusion Model for Accurate Foot X-ray Synthesis in Hallux Valgus Diagnosis	May 13, 2025	Image GenerationSSIM	CodeCode Available	0
Towards SFW sampling for diffusion models via external conditioning	May 12, 2025	Image Generation	CodeCode Available	0
Image-Guided Microstructure Optimization using Diffusion Models: Validated with Li-Mn-rich Cathode Precursors	May 12, 2025	Image Generation	—Unverified	0
Unified Continuous Generative Models	May 12, 2025	Image Generation	CodeCode Available	2
Metrics that matter: Evaluating image quality metrics for medical image generation	May 12, 2025	Image GenerationMedical Image Generation	CodeCode Available	0
Selftok: Discrete Visual Tokens of Autoregression, by Diffusion, and for Reasoning	May 12, 2025	Image GenerationReinforcement Learning (RL)	—Unverified	0
Replay-Based Continual Learning with Dual-Layered Distillation and a Streamlined U-Net for Efficient Text-to-Image Generation	May 11, 2025	Continual LearningImage Generation	—Unverified	0
Learning Graph Representation of Agent Diffusers	May 10, 2025	Graph Neural NetworkImage Generation	CodeCode Available	0
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation	May 10, 2025	cross-modal alignmentImage Generation	CodeCode Available	0
Accelerating Diffusion Transformer via Increment-Calibrated Caching with Channel-Aware Singular Value Decomposition	May 9, 2025	Image Generation	CodeCode Available	1
Noise-Consistent Siamese-Diffusion for Medical Image Synthesis and Segmentation	May 9, 2025	Image GenerationImage Segmentation	CodeCode Available	2
A Preliminary Study for GPT-4o on Image Restoration	May 8, 2025	Image DehazingImage Generation	CodeCode Available	1
Normalize Everything: A Preconditioned Magnitude-Preserving Architecture for Diffusion-Based Speech Enhancement	May 8, 2025	Image GenerationSpeech Enhancement	—Unverified	0
InstanceGen: Image Generation with Instance-level Instructions	May 8, 2025	Image Generation	CodeCode Available	2
Prompt to Polyp: Medical Text-Conditioned Image Synthesis with Diffusion Models	May 8, 2025	Image Generation	CodeCode Available	0
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis	May 8, 2025	8kData Augmentation	—Unverified	0
Does CLIP perceive art the same way we do?	May 8, 2025	Image GenerationScene Understanding	—Unverified	0
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation	May 8, 2025	Image GenerationText Generation	—Unverified	0
PIDiff: Image Customization for Personalized Identities with Diffusion Models	May 8, 2025	Image GenerationText to Image Generation	—Unverified	0
Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers	May 7, 2025	Image GenerationLayout Generation	—Unverified	0
Efficient Flow Matching using Latent Variables	May 7, 2025	Conditional Image GenerationImage Generation	—Unverified	0
Unmasking the Canvas: A Dynamic Benchmark for Image Generation Jailbreaking and LLM Content Safety	May 7, 2025	Image GenerationPrompt Engineering	—Unverified	0
MAISY: Motion-Aware Image SYnthesis for Medical Image Motion Correction	May 7, 2025	Generative Adversarial NetworkImage Generation	—Unverified	0
CRAFT: Cultural Russian-Oriented Dataset Adaptation for Focused Text-to-Image Generation	May 7, 2025	Image GenerationText to Image Generation	—Unverified	0
CountDiffusion: Text-to-Image Synthesis with Training-Free Counting-Guidance Diffusion	May 7, 2025	DenoisingImage Generation	—Unverified	0
Defining and Quantifying Creative Behavior in Popular Image Generators	May 7, 2025	Image Generation	—Unverified	0

Show:10 25 50

← PrevPage 6 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified