Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1501–1550 of 6689 papers

Title	Date	Tasks	Status	Hype
ChatHouseDiffusion: Prompt-Guided Generation and Editing of Floor Plans	Oct 15, 2024	Conditional Image GenerationImage Generation	CodeCode Available	1
A Simple Approach to Unifying Diffusion-based Conditional Generation	Oct 15, 2024	Image Generation	—Unverified	0
KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities	Oct 15, 2024	Image GenerationRetrieval	—Unverified	0
On the Effectiveness of Dataset Alignment for Fake Image Detection	Oct 15, 2024	DenoisingFake Image Detection	CodeCode Available	1
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling	Oct 15, 2024	Conditional Image GenerationImage Generation	—Unverified	0
Evolutionary Retrofitting	Oct 15, 2024	Code TranslationImage Generation	—Unverified	0
InvSeg: Test-Time Prompt Inversion for Semantic Segmentation	Oct 15, 2024	Image GenerationOpen Vocabulary Semantic Segmentation	—Unverified	0
Efficient Diffusion Models: A Comprehensive Survey from Principles to Practices	Oct 15, 2024	Image Generationmultimodal generation	CodeCode Available	1
How to Backdoor Consistency Models?	Oct 14, 2024	Image GenerationSpecificity	CodeCode Available	0
TextCtrl: Diffusion-based Scene Text Editing with Prior Guidance Control	Oct 14, 2024	DisentanglementImage Generation	CodeCode Available	2
FasterDiT: Towards Faster Diffusion Transformers Training without Architecture Modification	Oct 14, 2024	Image Generation	CodeCode Available	5
Two-Stage Approach for Brain MR Image Synthesis: 2D Image Synthesis and 3D Refinement	Oct 14, 2024	Brain Tumor SegmentationImage Generation	—Unverified	0
Saliency Guided Optimization of Diffusion Latents	Oct 14, 2024	global-optimizationImage Generation	—Unverified	0
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers	Oct 14, 2024	DecoderGPU	CodeCode Available	9
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling	Oct 14, 2024	DenoisingImage Generation	—Unverified	0
HART: Efficient Visual Generation with Hybrid Autoregressive Transformer	Oct 14, 2024	Image GenerationImage Reconstruction	CodeCode Available	9
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models	Oct 14, 2024	GPUImage Generation	—Unverified	0
Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations	Oct 14, 2024	Image Generation	—Unverified	0
Anatomical feature-prioritized loss for enhanced MR to CT translation	Oct 14, 2024	Image GenerationImage Reconstruction	CodeCode Available	1
Vision-guided and Mask-enhanced Adaptive Denoising for Prompt-based Image Editing	Oct 14, 2024	DenoisingImage Generation	CodeCode Available	0
When Does Perceptual Alignment Benefit Vision Representations?	Oct 14, 2024	Depth EstimationImage Generation	CodeCode Available	4
Customize Your Visual Autoregressive Recipe with Set Autoregressive Modeling	Oct 14, 2024	Image Generation	CodeCode Available	1
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective	Oct 14, 2024	cross-modal alignmentImage Generation	CodeCode Available	0
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity	Oct 14, 2024	DenoisingDichotomous Image Segmentation	CodeCode Available	2
First Creating Backgrounds Then Rendering Texts: A New Paradigm for Visual Text Blending	Oct 14, 2024	Image GenerationText Generation	CodeCode Available	1
EBDM: Exemplar-guided Image Translation with Brownian-bridge Diffusion Models	Oct 13, 2024	Conditional Image GenerationImage Generation	—Unverified	0
Generating Intermediate Representations for Compositional Text-To-Image Generation	Oct 13, 2024	Image GenerationText to Image Generation	CodeCode Available	0
Multi class activity classification in videos using Motion History Image generation	Oct 13, 2024	Action ClassificationAction Recognition	CodeCode Available	0
TULIP: Token-length Upgraded CLIP	Oct 13, 2024	Image GenerationPosition	CodeCode Available	1
DuoDiff: Accelerating Diffusion Models with a Dual-Backbone Approach	Oct 12, 2024	DenoisingImage Generation	CodeCode Available	0
CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation	Oct 12, 2024	Conditional Image GenerationGPU	CodeCode Available	3
RealEra: Semantic-level Concept Erasure via Neighbor-Concept Mining	Oct 11, 2024	Image GenerationSpecificity	—Unverified	0
One-shot Generative Domain Adaptation in 3D GANs	Oct 11, 2024	Domain AdaptationImage Generation	CodeCode Available	0
Diffusion Models Need Visual Priors for Image Generation	Oct 11, 2024	Image Generation	—Unverified	0
Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting	Oct 11, 2024	DiversityImage Generation	CodeCode Available	1
Score Neural Operator: A Generative Model for Learning and Generalizing Across Multiple Probability Distributions	Oct 11, 2024	Few-Shot LearningImage Generation	—Unverified	0
SceneCraft: Layout-Guided 3D Scene Generation	Oct 11, 2024	3D GenerationImage Generation	CodeCode Available	3
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis	Oct 10, 2024	Feature CompressionImage Generation	CodeCode Available	3
Scaling Laws For Diffusion Transformers	Oct 10, 2024	Image GenerationText to Image Generation	—Unverified	0
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models	Oct 10, 2024	Image GenerationLanguage Modeling	—Unverified	0
Relational Diffusion Distillation for Efficient Image Generation	Oct 10, 2024	Image GenerationKnowledge Distillation	CodeCode Available	0
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation	Oct 10, 2024	DenoisingImage Generation	—Unverified	0
Minority-Focused Text-to-Image Generation via Prompt Optimization	Oct 10, 2024	Data AugmentationImage Generation	CodeCode Available	1
Data Augmentation for Surgical Scene Segmentation with Anatomy-Aware Diffusion Models	Oct 10, 2024	AnatomyData Augmentation	CodeCode Available	0
A Unified Debiasing Approach for Vision-Language Models across Modalities and Tasks	Oct 10, 2024	FairnessImage Captioning	CodeCode Available	0
FLIER: Few-shot Language Image Models Embedded with Latent Representations	Oct 10, 2024	Image Generation	—Unverified	0
G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving	Oct 9, 2024	Image GenerationMotion Generation	—Unverified	0
TextLap: Customizing Language Models for Text-to-Layout Planning	Oct 9, 2024	Image GenerationNatural Language Understanding	CodeCode Available	1
On the Solution of Linearized Inverse Scattering Problems in Near-Field Microwave Imaging by Operator Inversion and Matched Filtering	Oct 9, 2024	Image Generation	—Unverified	0
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models	Oct 9, 2024	Image GenerationText to Image Generation	CodeCode Available	2

Show:10 25 50

← PrevPage 31 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified