Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 6689 papers

Title	Date	Tasks	Status	Hype
Amortizing intractable inference in diffusion models for vision, language, and control	May 31, 2024	continuous-controlContinuous Control	CodeCode Available	1
SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow	May 30, 2024	DiversityImage Generation	CodeCode Available	1
ETHER: Efficient Finetuning of Large-Scale Models with Hyperplane Reflections	May 30, 2024	Image Generation	CodeCode Available	1
ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning	May 29, 2024	Image GenerationText to Image Generation	CodeCode Available	1
User-Friendly Customized Generation with Multi-Modal Prompts	May 26, 2024	DescriptiveImage Generation	CodeCode Available	1
Automatic Jailbreaking of the Text-to-Image Generative AI Systems	May 26, 2024	Image GenerationInformation Retrieval	CodeCode Available	1
PTQ4DiT: Post-training Quantization for Diffusion Transformers	May 25, 2024	Image GenerationQuantization	CodeCode Available	1
Learning to Discretize Denoising Diffusion ODEs	May 24, 2024	DenoisingImage Generation	CodeCode Available	1
Unlearning Concepts in Diffusion Model via Concept Domain Correction and Concept Preserving Gradient	May 24, 2024	Image GenerationMachine Unlearning	CodeCode Available	1
Rate-Adaptive Quantization: A Multi-Rate Codebook Adaptation for Vector Quantization-based Generative Models	May 23, 2024	Data CompressionImage Generation	CodeCode Available	1
PaGoDA: Progressive Growing of a One-Step Generator from a Low-Resolution Diffusion Teacher	May 23, 2024	DecoderImage Generation	CodeCode Available	1
Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy	May 23, 2024	Data AugmentationImage Generation	CodeCode Available	1
MotionCraft: Physics-based Zero-Shot Video Generation	May 22, 2024	Image GenerationMissing Elements	CodeCode Available	1
UniRAG: Universal Retrieval Augmentation for Large Vision Language Models	May 16, 2024	Image CaptioningImage Generation	CodeCode Available	1
Quality Assessment for AI Generated Images with Instruction Tuning	May 12, 2024	Image GenerationImage Quality Assessment	CodeCode Available	1
Frame Interpolation with Consecutive Brownian Bridge Diffusion	May 9, 2024	Conditional Image GenerationImage Generation	CodeCode Available	1
CCDM: Continuous Conditional Diffusion Models for Image Generation	May 6, 2024	DenoisingImage Generation	CodeCode Available	1
TwinDiffusion: Enhancing Coherence and Efficiency in Panoramic Image Generation with Diffusion Models	Apr 30, 2024	Image Generation	CodeCode Available	1
G-Refine: A General Quality Refiner for Text-to-Image Generation	Apr 29, 2024	Image GenerationText to Image Generation	CodeCode Available	1
FlexiFilm: Long Video Generation with Flexible Conditions	Apr 29, 2024	Image GenerationVideo Generation	CodeCode Available	1
Causal Diffusion Autoencoders: Toward Counterfactual Generation via Diffusion Probabilistic Models	Apr 27, 2024	counterfactualDisentanglement	CodeCode Available	1
Denoising: from classical methods to deep CNNs	Apr 25, 2024	DenoisingImage Denoising	CodeCode Available	1
ArtNeRF: A Stylized Neural Field for 3D-Aware Cartoonized Face Synthesis	Apr 21, 2024	3D-Aware Image SynthesisContrastive Learning	CodeCode Available	1
A Dataset and Model for Realistic License Plate Deblurring	Apr 21, 2024	DeblurringGenerative Adversarial Network	CodeCode Available	1
Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images	Apr 19, 2024	Image Generation	CodeCode Available	1
TextCenGen: Attention-Guided Text-Centric Background Adaptation for Text-to-Image Generation	Apr 18, 2024	Image GenerationText to Image Generation	CodeCode Available	1
SSDiff: Spatial-spectral Integrated Diffusion Model for Remote Sensing Pansharpening	Apr 17, 2024	DenoisingImage Generation	CodeCode Available	1
LaDiC: Are Diffusion Models Really Inferior to Autoregressive Counterparts for Image-to-Text Generation?	Apr 16, 2024	Image CaptioningImage Generation	CodeCode Available	1
Applying Guidance in a Limited Interval Improves Sample and Distribution Quality in Diffusion Models	Apr 11, 2024	Image Generation	CodeCode Available	1
UDiFF: Generating Conditional Unsigned Distance Fields with Optimal Wavelet Diffusion	Apr 10, 2024	3D Shape GenerationImage Generation	CodeCode Available	1
Deep Generative Data Assimilation in Multimodal Setting	Apr 10, 2024	Image GenerationUncertainty Quantification	CodeCode Available	1
StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion	Apr 9, 2024	Image GenerationStory Visualization	CodeCode Available	1
DiffHarmony: Latent Diffusion Model Meets Image Harmonization	Apr 9, 2024	Image CompressionImage Generation	CodeCode Available	1
Tackling Structural Hallucination in Image Translation with Local Diffusion	Apr 9, 2024	HallucinationImage Generation	CodeCode Available	1
MC^2: Multi-concept Guidance for Customized Multi-concept Generation	Apr 8, 2024	Image GenerationText to Image Generation	CodeCode Available	1
Bi-LORA: A Vision-Language Approach for Synthetic Image Detection	Apr 2, 2024	Binary ClassificationImage Captioning	CodeCode Available	1
SCINeRF: Neural Radiance Fields from a Snapshot Compressive Image	Mar 29, 2024	Image GenerationImage Reconstruction	CodeCode Available	1
Benchmarking Counterfactual Image Generation	Mar 29, 2024	BenchmarkingConditional Image Generation	CodeCode Available	1
Vision-Language Synthetic Data Enhances Echocardiography Downstream Tasks	Mar 28, 2024	Image GenerationMedical Image Generation	CodeCode Available	1
DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis	Mar 27, 2024	Image GenerationMisinformation	CodeCode Available	1
Capability-aware Prompt Reformulation Learning for Text-to-Image Generation	Mar 27, 2024	Image GenerationText to Image Generation	CodeCode Available	1
Ship in Sight: Diffusion Models for Ship-Image Super Resolution	Mar 27, 2024	DenoisingImage Generation	CodeCode Available	1
Bidirectional Consistency Models	Mar 26, 2024	Image GenerationImage Inpainting	CodeCode Available	1
Graph Image Prior for Unsupervised Dynamic Cardiac Cine MRI Reconstruction	Mar 23, 2024	compressed sensingImage Generation	CodeCode Available	1
CLIP-VQDiffusion : Langauge Free Training of Text To Image generation using CLIP and vector quantized diffusion model	Mar 22, 2024	Conditional Image GenerationImage Generation	CodeCode Available	1
Diversity-aware Channel Pruning for StyleGAN Compression	Mar 20, 2024	DiversityImage Generation	CodeCode Available	1
Towards Learning Contrast Kinetics with Multi-Condition Latent Diffusion Models	Mar 20, 2024	Decision MakingImage Generation	CodeCode Available	1
Controllable Face Synthesis with Semantic Latent Diffusion Models	Mar 19, 2024	DiversityFace Generation	CodeCode Available	1
Binary Noise for Binary Tasks: Masked Bernoulli Diffusion for Unsupervised Anomaly Detection	Mar 18, 2024	Anomaly DetectionDenoising	CodeCode Available	1
IDF-CR: Iterative Diffusion Process for Divide-and-Conquer Cloud Removal in Remote-sensing Images	Mar 18, 2024	Cloud RemovalImage Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 21 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified