Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3001–3050 of 6689 papers

Title	Date	Tasks	Status
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation	Dec 10, 2024	Image GenerationLanguage Modelling	—Unverified
UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics	Dec 10, 2024	Image GenerationVideo Generation	—Unverified
Fusion Embedding for Pose-Guided Person Image Synthesis with Diffusion Model	Dec 10, 2024	Image Generation	CodeCode Available
FiVA: Fine-grained Visual Attribute Dataset for Text-to-Image Diffusion Models	Dec 10, 2024	AttributeImage Generation	—Unverified
Fine-grained Text to Image Synthesis	Dec 10, 2024	Contrastive LearningImage Generation	—Unverified
Preference Adaptive and Sequential Text-to-Image Generation	Dec 10, 2024	Image GenerationLanguage Modeling	—Unverified
A Generative Victim Model for Segmentation	Dec 10, 2024	Adversarial AttackImage Generation	—Unverified
Moderating the Generalization of Score-based Generative Model	Dec 10, 2024	Image GenerationImage Inpainting	—Unverified
Efficiency Meets Fidelity: A Novel Quantization Framework for Stable Diffusion	Dec 9, 2024	DenoisingImage Generation	—Unverified
ASGDiffusion: Parallel High-Resolution Generation with Asynchronous Structure Guidance	Dec 9, 2024	DenoisingGPU	—Unverified
Boosting Alignment for Post-Unlearning Text-to-Image Generative Models	Dec 9, 2024	Image GenerationMachine Unlearning	CodeCode Available
ILLUME: Illuminating Your LLMs to See, Draw, and Self-Enhance	Dec 9, 2024	Image GenerationLanguage Modeling	—Unverified
ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet	Dec 9, 2024	Image GenerationSemantic Segmentation	—Unverified
Visual Lexicon: Rich Image Features in Language Space	Dec 9, 2024	Image GenerationImage Reconstruction	—Unverified
Self-Guidance: Boosting Flow and Diffusion Generation on Their Own	Dec 8, 2024	Image GenerationText to Image Generation	—Unverified
BudgetFusion: Perceptually-Guided Adaptive Diffusion Models	Dec 8, 2024	DenoisingImage Generation	—Unverified
Open-Source Acceleration of Stable-Diffusion.cpp Deployable on All Devices	Dec 8, 2024	AllImage Generation	CodeCode Available
GraPE: A Generate-Plan-Edit Framework for Compositional T2I Synthesis	Dec 8, 2024	Image Generationtext-guided-image-editing	—Unverified
CSG: A Context-Semantic Guided Diffusion Approach in De Novo Musculoskeletal Ultrasound Image Generation	Dec 8, 2024	Image GenerationSemantic Segmentation	—Unverified
Language-Guided Image Tokenization for Generation	Dec 8, 2024	DescriptiveImage Generation	—Unverified
Nested Diffusion Models Using Hierarchical Latent Priors	Dec 8, 2024	Dimensionality ReductionImage Generation	—Unverified
SILMM: Self-Improving Large Multimodal Models for Compositional Text-to-Image Generation	Dec 8, 2024	DiversityImage Generation	—Unverified
Not Just Text: Uncovering Vision Modality Typographic Threats in Image Generation Models	Dec 7, 2024	Image Generation	—Unverified
A Tiered GAN Approach for Monet-Style Image Generation	Dec 7, 2024	Computational EfficiencyImage Generation	—Unverified
Noise Matters: Diffusion Model-based Urban Mobility Generation with Collaborative Noise Priors	Dec 6, 2024	Image Generation	—Unverified
The Silent Prompt: Initial Noise as Implicit Guidance for Goal-Driven Image Generation	Dec 6, 2024	DenoisingImage Generation	—Unverified
Continuous Video Process: Modeling Videos as Continuous Multi-Dimensional Processes for Video Prediction	Dec 6, 2024	Image GenerationNavigate	—Unverified
Structure-Aware Stylized Image Synthesis for Robust Medical Image Segmentation	Dec 5, 2024	Domain GeneralizationImage Generation	CodeCode Available
One Communication Round is All It Needs for Federated Fine-Tuning Foundation Models	Dec 5, 2024	AllImage Generation	—Unverified
AnyDressing: Customizable Multi-Garment Virtual Dressing via Latent Diffusion Models	Dec 5, 2024	Image Generation	—Unverified
Local Curvature Smoothing with Stein's Identity for Efficient Score Matching	Dec 5, 2024	DenoisingImage Generation	—Unverified
A Noise is Worth Diffusion Guidance	Dec 5, 2024	DenoisingImage Generation	—Unverified
BodyMetric: Evaluating the Realism of Human Bodies in Text-to-Image Generation	Dec 5, 2024	Image GenerationText to Image Generation	—Unverified
Multi-Subject Image Synthesis as a Generative Prior for Single-Subject PET Image Reconstruction	Dec 5, 2024	Image GenerationImage Reconstruction	—Unverified
The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation	Dec 5, 2024	BlockingImage Generation	—Unverified
Safeguarding Text-to-Image Generation via Inference-Time Prompt-Noise Optimization	Dec 5, 2024	Image GenerationText to Image Generation	CodeCode Available
LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors	Dec 5, 2024	Image GenerationText to Image Generation	—Unverified
CreatiLayout: Siamese Multimodal Diffusion Transformer for Creative Layout-to-Image Generation	Dec 5, 2024	Image GenerationLayout Generation	—Unverified
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts	Dec 5, 2024	BenchmarkingImage Generation	—Unverified
A Framework For Image Synthesis Using Supervised Contrastive Learning	Dec 5, 2024	Contrastive LearningGenerative Adversarial Network	—Unverified
Seamless Optical Cloud Computing across Edge-Metro Network for Generative AI	Dec 4, 2024	Cloud ComputingImage Generation	—Unverified
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation	Dec 4, 2024	Image GenerationLarge Language Model	—Unverified
DIVE: Taming DINO for Subject-Driven Video Editing	Dec 4, 2024	Image GenerationVideo Editing	—Unverified
Partially Conditioned Patch Parallelism for Accelerated Diffusion Model Inference	Dec 4, 2024	DenoisingImage Generation	—Unverified
Appearance Matching Adapter for Exemplar-based Semantic Image Synthesis	Dec 4, 2024	Image GenerationImage Segmentation	—Unverified
Panoptic Diffusion Models: co-generation of images and segmentation maps	Dec 4, 2024	Image GenerationPanoptic Segmentation	—Unverified
Geometry-guided Cross-view Diffusion for One-to-many Cross-view Image Synthesis	Dec 4, 2024	Image Generation	—Unverified
Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment	Dec 4, 2024	AttributeImage Generation	—Unverified
Generalized Diffusion Model with Adjusted Offset Noise	Dec 4, 2024	Audio SynthesisDrug Discovery	—Unverified
Flow Matching with General Discrete Paths: A Kinetic-Optimal Perspective	Dec 4, 2024	Image GenerationText Generation	—Unverified

Show:10 25 50

← PrevPage 61 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified