Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4150 of 6689 papers

Title	Date	Tasks	Status
Breaking Free: How to Hack Safety Guardrails in Black-Box Diffusion Models!	Feb 7, 2024	Evolutionary AlgorithmsImage Generation	CodeCode Available
Text2Street: Controllable Text-to-image Generation for Street Views	Feb 7, 2024	Image GenerationLayout Generation	—Unverified
FoolSDEdit: Deceptively Steering Your Edits Towards Targeted Attribute-aware Distribution	Feb 6, 2024	Adversarial AttackAttribute	—Unverified
Do Diffusion Models Learn Semantically Meaningful and Efficient Representations?	Feb 5, 2024	Image Generation	—Unverified
M^3Face: A Unified Multi-Modal Multilingual Framework for Human Face Generation and Editing	Feb 4, 2024	Face GenerationImage Generation	—Unverified
Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples	Feb 3, 2024	Image GenerationTime Series	—Unverified
Separable Multi-Concept Erasure from Diffusion Models	Feb 3, 2024	Image GenerationMachine Unlearning	—Unverified
Mobile Fitting Room: On-device Virtual Try-on via Diffusion Models	Feb 2, 2024	Image GenerationModel Compression	—Unverified
Variational Quantum Circuits Enhanced Generative Adversarial Network	Feb 2, 2024	BenchmarkingGenerative Adversarial Network	—Unverified
Can Shape-Infused Joint Embeddings Improve Image-Conditioned 3D Diffusion?	Feb 2, 2024	DenoisingDiversity	—Unverified
Neural Language of Thought Models	Feb 2, 2024	Image GenerationObject	—Unverified
Unconditional Latent Diffusion Models Memorize Patient Imaging Data: Implications for Openly Sharing Synthetic Data	Feb 1, 2024	Copy DetectionData Augmentation	CodeCode Available
High-Quality Medical Image Generation from Free-hand Sketch	Feb 1, 2024	Image GenerationMedical Image Generation	—Unverified
Head and Neck Tumor Segmentation from [18F]F-FDG PET/CT Images Based on 3D Diffusion Model	Jan 31, 2024	Image GenerationSegmentation	—Unverified
Fréchet Distance for Offline Evaluation of Information Retrieval Systems with Sparse Labels	Jan 31, 2024	Image GenerationInformation Retrieval	—Unverified
Beyond Inserting: Learning Identity Embedding for Semantic-Fidelity Personalized Diffusion Generation	Jan 31, 2024	Image GenerationPersonalized Image Generation	—Unverified
Image Anything: Towards Reasoning-coherent and Training-free Multi-modal Image Generation	Jan 31, 2024	AttributeImage Generation	—Unverified
Diffusion Model Compression for Image-to-Image Translation	Jan 31, 2024	Conditional Image GenerationDenoising	—Unverified
X-ray Image Generation as a Method of Performance Prediction for Real-Time Inspection: a Case Study	Jan 30, 2024	Image Generation	CodeCode Available
Diffutoon: High-Resolution Editable Toon Shading via Diffusion Models	Jan 29, 2024	ColorizationImage Generation	—Unverified
Multilingual Text-to-Image Generation Magnifies Gender Stereotypes and Prompt Engineering May Not Help You	Jan 29, 2024	Image GenerationMultilingual Text-to-Image Generation	CodeCode Available
Bridging Generative and Discriminative Models for Unified Visual Perception with Diffusion Priors	Jan 29, 2024	DecoderImage Generation	—Unverified
Spatial-Aware Latent Initialization for Controllable Image Generation	Jan 29, 2024	DenoisingImage Generation	—Unverified
Object-Driven One-Shot Fine-tuning of Text-to-Image Diffusion with Prototypical Embedding	Jan 28, 2024	Image GenerationObject	—Unverified
Divide and Conquer: Language Models can Plan and Self-Correct for Compositional Text-to-Image Generation	Jan 28, 2024	AttributeImage Generation	—Unverified
Annotated Hands for Generative Models	Jan 26, 2024	Generative Adversarial NetworkImage Generation	CodeCode Available
Image Synthesis with Graph Conditioning: CLIP-Guided Diffusion Models for Scene Graphs	Jan 25, 2024	Image Generation	—Unverified
Explicitly Representing Syntax Improves Sentence-to-layout Prediction of Unexpected Situations	Jan 25, 2024	Image GenerationSentence	CodeCode Available
StyleInject: Parameter Efficient Tuning of Text-to-Image Diffusion Models	Jan 25, 2024	DiversityImage Generation	—Unverified
UrbanGenAI: Reconstructing Urban Landscapes using Panoptic Segmentation and Diffusion Models	Jan 25, 2024	Image GenerationImage Segmentation	—Unverified
No Longer Trending on Artstation: Prompt Analysis of Generative AI Art	Jan 24, 2024	Image Generation	—Unverified
UNIMO-G: Unified Image Generation through Multimodal Conditional Diffusion	Jan 24, 2024	Conditional Image GenerationDenoising	—Unverified
CIMGEN: Controlled Image Manipulation by Finetuning Pretrained Generative Models on Limited Data	Jan 23, 2024	Conditional Image GenerationImage Generation	—Unverified
Faster Projected GAN: Towards Faster Few-Shot Image Generation	Jan 23, 2024	Image Generation	—Unverified
Codebook-enabled Generative End-to-end Semantic Communication Powered by Transformer	Jan 22, 2024	Image GenerationSemantic Communication	—Unverified
Text-to-Image Cross-Modal Generation: A Systematic Review	Jan 21, 2024	Image GenerationText to Image Generation	—Unverified
Large-scale Reinforcement Learning for Diffusion Models	Jan 20, 2024	DiversityEthics	—Unverified
Diffusion Model Conditioning on Gaussian Mixture Model and Negative Gaussian Mixture Gradient	Jan 20, 2024	DenoisingDiversity	—Unverified
CLIP Model for Images to Textual Prompts Based on Top-k Neighbors	Jan 18, 2024	Image Generationmultimodal generation	—Unverified
DiffusionGPT: LLM-Driven Text-to-Image Generation System	Jan 18, 2024	Image GenerationModel Selection	—Unverified
Efficient generative adversarial networks using linear additive-attention Transformers	Jan 17, 2024	Generative Adversarial NetworkImage Generation	CodeCode Available
Instilling Multi-round Thinking to Text-guided Image Generation	Jan 16, 2024	Image Generationtext-guided-generation	—Unverified
SCoFT: Self-Contrastive Fine-Tuning for Equitable Image Generation	Jan 16, 2024	Image Generation	—Unverified
Key-point Guided Deformable Image Manipulation Using Diffusion Model	Jan 16, 2024	Image GenerationImage Manipulation	—Unverified
Generation of Synthetic Images for Pedestrian Detection Using a Sequence of GANs	Jan 14, 2024	Image GenerationPedestrian Detection	—Unverified
ViSAGe: A Global-Scale Analysis of Visual Stereotypes in Text-to-Image Generation	Jan 12, 2024	Image GenerationText to Image Generation	CodeCode Available
Seek for Incantations: Towards Accurate Text-to-Image Diffusion Synthesis through Prompt Engineering	Jan 12, 2024	Image GenerationPrompt Engineering	—Unverified
Frequency-Time Diffusion with Neural Cellular Automata	Jan 11, 2024	DenoisingImage Generation	—Unverified
Parrot: Pareto-optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation	Jan 11, 2024	Image GenerationReinforcement Learning (RL)	—Unverified
Scissorhands: Scrub Data Influence via Connection Sensitivity in Networks	Jan 11, 2024	image-classificationImage Classification	CodeCode Available

Show:10 25 50

← PrevPage 83 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified