Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 6689 papers

Title	Date	Tasks	Status
StableMaterials: Enhancing Diversity in Material Generation via Semi-Supervised Learning	Jun 13, 2024	DiversityImage Generation	—Unverified
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation	Jun 12, 2024	Image GenerationText to Image Generation	—Unverified
What If We Recaption Billions of Web Images with LLaMA-3?	Jun 12, 2024	Cross-Modal RetrievalImage Generation	—Unverified
DiTFastAttn: Attention Compression for Diffusion Transformer Models	Jun 12, 2024	2kImage Generation	—Unverified
Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation	Jun 12, 2024	Image GenerationPerceptual Distance	—Unverified
WMAdapter: Adding WaterMark Control to Latent Diffusion Models	Jun 12, 2024	Image GenerationTransfer Learning	—Unverified
Understanding and Mitigating Compositional Issues in Text-to-Image Generative Models	Jun 12, 2024	Image Generation	CodeCode Available
Diffusion Soup: Model Merging for Text-to-Image Diffusion Models	Jun 12, 2024	Continual LearningImage Generation	—Unverified
Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance	Jun 11, 2024	Appearance TransferImage Generation	—Unverified
Beware of Aliases -- Signal Preservation is Crucial for Robust Image Restoration	Jun 11, 2024	DecoderImage Generation	—Unverified
Understanding Visual Concepts Across Models	Jun 11, 2024	Image Generationobject-detection	CodeCode Available
Progress Towards Decoding Visual Imagery via fNIRS	Jun 11, 2024	Image GenerationImage Reconstruction	—Unverified
Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense?	Jun 11, 2024	Adversarial TextImage Generation	—Unverified
Eye-for-an-eye: Appearance Transfer with Semantic Correspondence in Diffusion Models	Jun 11, 2024	Appearance TransferImage Generation	—Unverified
Instant 3D Human Avatar Generation using Image Diffusion Models	Jun 11, 2024	3D GenerationImage Generation	—Unverified
The Effect of Training Dataset Size on Discriminative and Diffusion-Based Speech Enhancement Systems	Jun 10, 2024	DiversityImage Generation	—Unverified
Can Prompt Modifiers Control Bias? A Comparative Analysis of Text-to-Image Generative Models	Jun 9, 2024	DiversityEthics	—Unverified
TIGeR: Unifying Text-to-Image Generation and Retrieval with Large Multimodal Models	Jun 9, 2024	counterfactualImage Generation	—Unverified
OmniControlNet: Dual-stage Integration for Conditional Image Generation	Jun 9, 2024	Conditional Image GenerationImage Generation	—Unverified
Regularized Training with Generated Datasets for Name-Only Transfer of Vision-Language Models	Jun 8, 2024	DiversityImage Generation	CodeCode Available
Rapid Review of Generative AI in Smart Medical Applications	Jun 8, 2024	DiagnosticImage Generation	—Unverified
GANetic Loss for Generative Adversarial Networks with a Focus on Medical Applications	Jun 7, 2024	Anomaly DetectionImage Generation	CodeCode Available
AttnDreamBooth: Towards Text-Aligned Personalized Text-to-Image Generation	Jun 7, 2024	AttributeImage Generation	—Unverified
Optimal Eye Surgeon: Finding Image Priors through Sparse Generators at Initialization	Jun 7, 2024	Image GenerationImage Restoration	CodeCode Available
PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction	Jun 7, 2024	Image GenerationImage Retrieval	CodeCode Available
Coherent Zero-Shot Visual Instruction Generation	Jun 6, 2024	Image GenerationReading Comprehension	—Unverified
BitsFusion: 1.99 bits Weight Quantization of Diffusion Model	Jun 6, 2024	Image Generationmodel	—Unverified
Diffusion-based image inpainting with internal learning	Jun 6, 2024	Image GenerationImage Inpainting	CodeCode Available
ReDistill: Residual Encoded Distillation for Peak Memory Reduction	Jun 6, 2024	DenoisingGPU	—Unverified
DiffuSyn Bench: Evaluating Vision-Language Models on Real-World Complexities with Diffusion-Generated Synthetic Benchmarks	Jun 6, 2024	Image GenerationRetrieval	—Unverified
Understanding the Limitations of Diffusion Concept Algebra Through Food	Jun 5, 2024	DiversityImage Generation	—Unverified
Inv-Adapter: ID Customization Generation via Image Inversion and Lightweight Adapter	Jun 5, 2024	Image GenerationText to Image Generation	—Unverified
Enhancing Traffic Sign Recognition with Tailored Data Augmentation: Addressing Class Imbalance and Instance Scarcity	Jun 5, 2024	Data AugmentationImage Generation	—Unverified
Tackling Copyright Issues in AI Image Generation Through Originality Estimation and Genericization	Jun 5, 2024	Image Generation	CodeCode Available
Analyzing the Feature Extractor Networks for Face Image Synthesis	Jun 4, 2024	BenchmarkingImage Generation	CodeCode Available
The Crystal Ball Hypothesis in diffusion models: Anticipating object positions from initial noise	Jun 4, 2024	Image GenerationObject	—Unverified
Enhance Image-to-Image Generation with LLaVA-generated Prompts	Jun 4, 2024	Image Generation	—Unverified
Plug-and-Play Diffusion Distillation	Jun 4, 2024	Image Generation	—Unverified
I4VGen: Image as Free Stepping Stone for Text-to-Video Generation	Jun 4, 2024	DiversityImage Generation	—Unverified
It's a Feature, Not a Bug: Measuring Creative Fluidity in Image Generators	Jun 3, 2024	Image Generation	—Unverified
Differentially Private Fine-Tuning of Diffusion Models	Jun 3, 2024	Image GenerationMemorization	—Unverified
ATTIQA: Generalizable Image Quality Feature Extractor using Attribute-aware Pretraining	Jun 3, 2024	AttributeImage Enhancement	—Unverified
Δ-DiT: A Training-Free Acceleration Method Tailored for Diffusion Transformers	Jun 3, 2024	Image Generation	CodeCode Available
Layout Agnostic Scene Text Image Synthesis with Diffusion Models	Jun 3, 2024	DiversityImage Generation	—Unverified
Anomaly Anything: Promptable Unseen Visual Anomaly Generation	Jun 3, 2024	Anomaly DetectionImage Generation	—Unverified
Text-guided Controllable Mesh Refinement for Interactive 3D Modeling	Jun 3, 2024	Image Generation	—Unverified
fruit-SALAD: A Style Aligned Artwork Dataset to reveal similarity perception in image embeddings	Jun 3, 2024	Image Generation	CodeCode Available
pOps: Photo-Inspired Diffusion Operators	Jun 3, 2024	Image Generation	—Unverified
Dimba: Transformer-Mamba Diffusion Models	Jun 3, 2024	Image GenerationMamba	—Unverified
ParallelEdits: Efficient Multi-object Image Editing	Jun 3, 2024	AttributeImage Generation	—Unverified

Show:10 25 50

← PrevPage 74 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified