Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3750 of 6689 papers

Title	Date	Tasks	Status
Visual Car Brand Classification by Implementing a Synthetic Image Dataset Creation Pipeline	Jun 3, 2024	image-classificationImage Classification	—Unverified
Enhancing Counterfactual Image Generation Using Mahalanobis Distance with Distribution Preferences in Feature Space	May 31, 2024	counterfactualCounterfactual Explanation	—Unverified
Kaleido Diffusion: Improving Conditional Diffusion Models with Autoregressive Latent Modeling	May 31, 2024	DiversityImage Generation	—Unverified
Adv-KD: Adversarial Knowledge Distillation for Faster Diffusion Sampling	May 31, 2024	DenoisingImage Generation	CodeCode Available
Information Theoretic Text-to-Image Alignment	May 31, 2024	DenoisingImage Generation	—Unverified
You Only Scan Once: Efficient Multi-dimension Sequential Modeling with LightNet	May 31, 2024	image-classificationImage Classification	—Unverified
Cyclic image generation using chaotic dynamics	May 31, 2024	DiversityImage Generation	CodeCode Available
RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection	May 30, 2024	Image Generation	—Unverified
Learning 3D Robotics Perception using Inductive Priors	May 30, 2024	3D ReconstructionImage Generation	—Unverified
Boost Your Human Image Generation Model via Direct Preference Optimization	May 30, 2024	AnatomyImage Generation	—Unverified
Quo Vadis ChatGPT? From Large Language Models to Large Knowledge Models	May 29, 2024	Image GenerationText Summarization	—Unverified
Going beyond Compositions, DDPMs Can Produce Zero-Shot Interpolations	May 29, 2024	DenoisingImage Generation	CodeCode Available
MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection	May 29, 2024	Image GenerationMedical Image Generation	CodeCode Available
Topological Perspectives on Optimal Multimodal Embedding Spaces	May 29, 2024	Image GenerationText to Image Generation	—Unverified
Inpaint Biases: A Pathway to Accurate and Unbiased Image Generation	May 29, 2024	Image Generation	—Unverified
SketchTriplet: Self-Supervised Scenarized Sketch-Text-Image Triplet Generation	May 29, 2024	Image GenerationImage Retrieval	—Unverified
The ethical situation of DALL-E 2	May 29, 2024	Image Generation	—Unverified
Patch-enhanced Mask Encoder Prompt Image Generation	May 29, 2024	Image Generation	—Unverified
Zero-to-Hero: Enhancing Zero-Shot Novel View Synthesis via Attention Map Filtering	May 29, 2024	DenoisingImage Generation	—Unverified
Multi-modal Generation via Cross-Modal In-Context Learning	May 28, 2024	Image GenerationIn-Context Learning	CodeCode Available
MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding	May 28, 2024	Brain DecodingImage Generation	—Unverified
Are Images Indistinguishable to Humans Also Indistinguishable to Classifiers?	May 28, 2024	DiagnosticImage Generation	—Unverified
The Poisson Midpoint Method for Langevin Dynamics: Provably Efficient Discretization for Diffusion Models	May 27, 2024	Image Generation	—Unverified
TIE: Revolutionizing Text-based Image Editing for Complex-Prompt Following and High-Fidelity Editing	May 27, 2024	Image GenerationText-based Image Editing	—Unverified
RefDrop: Controllable Consistency in Image or Video Generation via Reference Feature Guidance	May 27, 2024	Image GenerationVideo Generation	—Unverified
Training-free Editioning of Text-to-Image Models	May 27, 2024	Image Generation	—Unverified
Unified Editing of Panorama, 3D Scenes, and Videos Through Disentangled Self-Attention Injection	May 27, 2024	Image GenerationVideo Editing	—Unverified
Glauber Generative Model: Discrete Diffusion Models via Binary Classification	May 27, 2024	Binary ClassificationDenoising	—Unverified
Anonymization Prompt Learning for Facial Privacy-Preserving Text-to-Image Generation	May 27, 2024	Face SwappingImage Generation	—Unverified
Enhancing Consistency-Based Image Generation via Adversarialy-Trained Classification and Energy-Based Discrimination	May 25, 2024	Image Generation	CodeCode Available
Lateralization MLP: A Simple Brain-inspired Architecture for Diffusion	May 25, 2024	Image GenerationText to Image Generation	CodeCode Available
Method and Software Tool for Generating Artificial Databases of Biomedical Images Based on Deep Neural Networks	May 25, 2024	Image Generation	—Unverified
ArtWeaver: Advanced Dynamic Style Integration via Diffusion Model	May 24, 2024	DenoisingImage Generation	—Unverified
SG-Adapter: Enhancing Text-to-Image Generation with Scene Graph Guidance	May 24, 2024	Image GenerationText to Image Generation	—Unverified
Scaling Diffusion Mamba with Bidirectional SSMs for Efficient Image and Video Generation	May 24, 2024	Image GenerationMamba	—Unverified
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance	May 23, 2024	Face GenerationImage Generation	—Unverified
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models	May 23, 2024	Computational EfficiencyDecoder	—Unverified
Good Seed Makes a Good Crop: Discovering Secret Seeds in Text-to-Image Diffusion Models	May 23, 2024	Image Generation	—Unverified
Time Cell Inspired Temporal Codebook in Spiking Neural Networks for Enhanced Image Generation	May 23, 2024	Image Generation	—Unverified
Diffusion models for Gaussian distributions: Exact solutions and Wasserstein errors	May 23, 2024	Gaussian ProcessesImage Generation	—Unverified
FreeTuner: Any Subject in Any Style with Training-free Diffusion	May 23, 2024	DisentanglementImage Generation	—Unverified
Conditional Diffusion on Web-Scale Image Pairs leads to Diverse Image Variations	May 23, 2024	Image GenerationImage-Variation	—Unverified
DLPO: Diffusion Model Loss-Guided Reinforcement Learning for Fine-Tuning Text-to-Speech Diffusion Models	May 23, 2024	Image Generationreinforcement-learning	—Unverified
The Disappearance of Timestep Embedding in Modern Time-Dependent Neural Networks	May 23, 2024	Image Generation	CodeCode Available
Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising	May 23, 2024	DenoisingImage Generation	—Unverified
LG-VQ: Language-Guided Codebook Learning	May 23, 2024	Image CaptioningImage Generation	—Unverified
Visual Analysis of Prediction Uncertainty in Neural Networks for Deep Image Synthesis	May 22, 2024	DiversityImage Generation	—Unverified
A Study of Posterior Stability for Time-Series Latent Diffusion	May 22, 2024	DecoderImage Generation	—Unverified
Curriculum Direct Preference Optimization for Diffusion and Consistency Models	May 22, 2024	Image GenerationText to Image Generation	CodeCode Available
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation	May 22, 2024	DenoisingImage Generation	—Unverified

Show:10 25 50

← PrevPage 75 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified