Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 6689 papers

Title	Date	Tasks	Status
Improving Compositional Generation with Diffusion Models Using Lift Scores	May 19, 2025	Image GenerationPosition	CodeCode Available
Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model	May 19, 2025	DecoderDenoising	CodeCode Available
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking	May 19, 2025	Image GenerationMamba	—Unverified
Few-Shot Concept Unlearning with Low Rank Adaptation	May 18, 2025	DenoisingImage Generation	—Unverified
Guiding Diffusion with Deep Geometric Moments: Balancing Fidelity and Variation	May 18, 2025	DiversityImage Generation	—Unverified
Model alignment using inter-modal bridges	May 18, 2025	Image Generationmodel	—Unverified
Context-Aware Autoregressive Models for Multi-Conditional Image Generation	May 18, 2025	Conditional Image GenerationImage Generation	—Unverified
Exploring Sparsity for Parameter Efficient Fine Tuning Using Wavelets	May 18, 2025	DiversityImage Generation	CodeCode Available
Measurement Score-Based Diffusion Model	May 17, 2025	Image Generationmodel	CodeCode Available
DRAGON: A Large-Scale Dataset of Realistic Images Generated by Diffusion Models	May 16, 2025	Image GenerationLarge Language Model	—Unverified
PSDiffusion: Harmonized Multi-Layer Image Generation via Layout and Appearance Alignment	May 16, 2025	Image GenerationText to Image Generation	—Unverified
CompAlign: Improving Compositional Text-to-Image Generation with a Complex Benchmark and Fine-Grained Feedback	May 16, 2025	AttributeImage Generation	—Unverified
HSRMamba: Efficient Wavelet Stripe State Space Model for Hyperspectral Image Super-Resolution	May 16, 2025	Computational EfficiencyHyperspectral Image Super-Resolution	CodeCode Available
DDAE++: Enhancing Diffusion Models Towards Unified Generative and Discriminative Learning	May 16, 2025	DenoisingImage Generation	—Unverified
Generative Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges	May 16, 2025	Data AugmentationDiagnostic	—Unverified
Shackled Dancing: A Bit-Locked Diffusion Algorithm for Lossless and Controllable Image Steganography	May 16, 2025	Image GenerationImage Steganography	—Unverified
LoFT: LoRA-fused Training Dataset Generation with Few-shot Guidance	May 16, 2025	Dataset GenerationDiversity	CodeCode Available
IMAGE-ALCHEMY: Advancing subject fidelity in personalised text-to-image generation	May 15, 2025	Image GenerationText to Image Generation	—Unverified
End-to-End Vision Tokenizer Tuning	May 15, 2025	Image GenerationQuestion Answering	—Unverified
Don't Forget your Inverse DDIM for Image Editing	May 14, 2025	Image GenerationText to Image Generation	—Unverified
An Initial Exploration of Default Images in Text-to-Image Generation	May 14, 2025	Image GenerationPrompt Engineering	—Unverified
EnerVerse-AC: Envisioning Embodied Environments with Action Condition	May 14, 2025	Image GenerationImitation Learning	—Unverified
Skeleton-Guided Diffusion Model for Accurate Foot X-ray Synthesis in Hallux Valgus Diagnosis	May 13, 2025	Image GenerationSSIM	CodeCode Available
Selftok: Discrete Visual Tokens of Autoregression, by Diffusion, and for Reasoning	May 12, 2025	Image GenerationReinforcement Learning (RL)	—Unverified
Metrics that matter: Evaluating image quality metrics for medical image generation	May 12, 2025	Image GenerationMedical Image Generation	CodeCode Available
Towards SFW sampling for diffusion models via external conditioning	May 12, 2025	Image Generation	CodeCode Available
Image-Guided Microstructure Optimization using Diffusion Models: Validated with Li-Mn-rich Cathode Precursors	May 12, 2025	Image Generation	—Unverified
Replay-Based Continual Learning with Dual-Layered Distillation and a Streamlined U-Net for Efficient Text-to-Image Generation	May 11, 2025	Continual LearningImage Generation	—Unverified
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation	May 10, 2025	cross-modal alignmentImage Generation	CodeCode Available
Learning Graph Representation of Agent Diffusers	May 10, 2025	Graph Neural NetworkImage Generation	CodeCode Available
PIDiff: Image Customization for Personalized Identities with Diffusion Models	May 8, 2025	Image GenerationText to Image Generation	—Unverified
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation	May 8, 2025	Image GenerationText Generation	—Unverified
Does CLIP perceive art the same way we do?	May 8, 2025	Image GenerationScene Understanding	—Unverified
Normalize Everything: A Preconditioned Magnitude-Preserving Architecture for Diffusion-Based Speech Enhancement	May 8, 2025	Image GenerationSpeech Enhancement	—Unverified
Prompt to Polyp: Medical Text-Conditioned Image Synthesis with Diffusion Models	May 8, 2025	Image Generation	CodeCode Available
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis	May 8, 2025	8kData Augmentation	—Unverified
Efficient Flow Matching using Latent Variables	May 7, 2025	Conditional Image GenerationImage Generation	—Unverified
Defining and Quantifying Creative Behavior in Popular Image Generators	May 7, 2025	Image Generation	—Unverified
MAISY: Motion-Aware Image SYnthesis for Medical Image Motion Correction	May 7, 2025	Generative Adversarial NetworkImage Generation	—Unverified
Unmasking the Canvas: A Dynamic Benchmark for Image Generation Jailbreaking and LLM Content Safety	May 7, 2025	Image GenerationPrompt Engineering	—Unverified
CRAFT: Cultural Russian-Oriented Dataset Adaptation for Focused Text-to-Image Generation	May 7, 2025	Image GenerationText to Image Generation	—Unverified
CountDiffusion: Text-to-Image Synthesis with Training-Free Counting-Guidance Diffusion	May 7, 2025	DenoisingImage Generation	—Unverified
Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers	May 7, 2025	Image GenerationLayout Generation	—Unverified
Real-Time Person Image Synthesis Using a Flow Matching Model	May 6, 2025	Image GenerationVideo Generation	CodeCode Available
Distribution-Conditional Generation: From Class Distribution to Creative Generation	May 6, 2025	Image Generation	—Unverified
Safer Prompts: Reducing IP Risk in Visual Generative AI	May 6, 2025	Image GenerationPrompt Engineering	—Unverified
Preliminary Explorations with GPT-4o(mni) Native Image Generation	May 6, 2025	Image Generationmultimodal generation	—Unverified
Multimodal Benchmarking and Recommendation of Text-to-Image Generation Models	May 6, 2025	BenchmarkingImage Generation	CodeCode Available
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation	May 5, 2025	Image GenerationScene Generation	—Unverified
Text to Image Generation and Editing: A Survey	May 5, 2025	Image GenerationMamba	—Unverified

Show:10 25 50

← PrevPage 47 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified