Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–3000 of 6689 papers

Title	Date	Tasks	Status	Hype
Towards the Unification of Generative and Discriminative Visual Foundation Model: A Survey	Dec 15, 2023	Image GenerationImage Segmentation	—Unverified	0
Faster Diffusion: Rethinking the Role of the Encoder for Diffusion Model Inference	Dec 15, 2023	DecoderDenoising	CodeCode Available	2
Color Agnostic Cross-Spectral Disparity Estimation	Dec 14, 2023	Disparity EstimationImage Generation	CodeCode Available	0
Local Conditional Controlling for Text-to-Image Diffusion Models	Dec 14, 2023	Image Generation	—Unverified	0
DreamDrone: Text-to-Image Diffusion Models are Zero-shot Perpetual View Generators	Dec 14, 2023	Image GenerationPerpetual View Generation	—Unverified	0
ArchiGuesser -- AI Art Architecture Educational Game	Dec 14, 2023	Board GamesDiversity	CodeCode Available	0
PI3D: Efficient Text-to-3D Generation with Pseudo-Image Diffusion	Dec 14, 2023	3D GenerationImage Generation	—Unverified	0
VaLID: Variable-Length Input Diffusion for Novel View Synthesis	Dec 14, 2023	Image GenerationNovel View Synthesis	—Unverified	0
VL-GPT: A Generative Pre-trained Transformer for Vision and Language Understanding and Generation	Dec 14, 2023	Image CaptioningImage Generation	CodeCode Available	1
VideoLCM: Video Latent Consistency Model	Dec 14, 2023	Computational EfficiencyImage Generation	—Unverified	0
3DGS-Avatar: Animatable Avatars via Deformable 3D Gaussian Splatting	Dec 14, 2023	3DGSImage Generation	CodeCode Available	2
LIME: Localized Image Editing via Attention Regularization in Diffusion Models	Dec 14, 2023	DenoisingImage Generation	—Unverified	0
Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time	Dec 14, 2023	Image GenerationMachine Translation	CodeCode Available	0
Agent Attention: On the Integration of Softmax and Linear Attention	Dec 14, 2023	Computational Efficiencyimage-classification	CodeCode Available	2
ZeroRF: Fast Sparse View 360° Reconstruction with Zero Pretraining	Dec 14, 2023	Image GenerationNeRF	—Unverified	0
ArcGAN: Generative Adversarial Networks for 3D Architectural Image Generation	Dec 14, 2023	3D Architecture3D Depth Estimation	—Unverified	0
FineControlNet: Fine-level Text Control for Image Generation with Spatially Aligned Text Control Injection	Dec 14, 2023	Image Generation	—Unverified	0
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models	Dec 13, 2023	Image GenerationKnowledge Distillation	—Unverified	0
DiffuseRAW: End-to-End Generative RAW Image Processing for Low-Light Images	Dec 13, 2023	Image EnhancementImage Generation	—Unverified	0
Diffusion-based Blind Text Image Super-Resolution	Dec 13, 2023	Image GenerationImage Super-Resolution	CodeCode Available	1
SEEAvatar: Photorealistic Text-to-3D Avatar Generation with Constrained Geometry and Appearance	Dec 13, 2023	Image GenerationPrompt Engineering	—Unverified	0
SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models	Dec 13, 2023	Image Generation	—Unverified	0
The Lottery Ticket Hypothesis in Denoising: Towards Semantic-Driven Initialization	Dec 13, 2023	DenoisingImage Generation	CodeCode Available	1
Enhancing CT Image synthesis from multi-modal MRI data based on a multi-task neural network framework	Dec 13, 2023	Image GenerationImage Segmentation	—Unverified	0
ρ-Diffusion: A diffusion-based density estimation framework for computational physics	Dec 13, 2023	DenoisingDensity Estimation	CodeCode Available	0
Clockwork Diffusion: Efficient Generation With Model-Step Distillation	Dec 13, 2023	DenoisingImage Generation	CodeCode Available	1
Time Series Diffusion Method: A Denoising Diffusion Probabilistic Model for Vibration Signal Generation	Dec 13, 2023	DenoisingFault Diagnosis	—Unverified	0
Diffusion Models Enable Zero-Shot Pose Estimation for Lower-Limb Prosthetic Users	Dec 13, 2023	Image GenerationPose Estimation	—Unverified	0
AdapEdit: Spatio-Temporal Guided Adaptive Editing Algorithm for Text-Based Continuity-Sensitive Image Editing	Dec 13, 2023	Image GenerationText to Image Generation	CodeCode Available	0
Knowledge-Aware Artifact Image Synthesis with LLM-Enhanced Prompting and Multi-Source Supervision	Dec 13, 2023	Image GenerationText to Image Generation	CodeCode Available	0
Semantic-aware Data Augmentation for Text-to-image Synthesis	Dec 13, 2023	Data AugmentationImage Generation	CodeCode Available	0
3DGEN: A GAN-based approach for generating novel 3D models from image data	Dec 13, 2023	Game DesignImage Generation	—Unverified	0
Stable Rivers: A Case Study in the Application of Text-to-Image Generative Models for Earth Sciences	Dec 13, 2023	FairnessImage Generation	—Unverified	0
SimAC: A Simple Anti-Customization Method for Protecting Face Privacy against Text-to-Image Synthesis of Diffusion Models	Dec 13, 2023	DenoisingImage Generation	CodeCode Available	1
A Survey of Generative AI for Intelligent Transportation Systems: Road Transportation Perspective	Dec 13, 2023	Decision MakingImage Generation	—Unverified	0
Diffusion Cocktail: Mixing Domain-Specific Diffusion Models for Diversified Image Generations	Dec 12, 2023	Image GenerationImage Manipulation	CodeCode Available	1
Harnessing LLM to Attack LLM-Guarded Text-to-Image Models	Dec 12, 2023	Image GenerationText-to-Image Generation	CodeCode Available	1
DiffuVST: Narrating Fictional Scenes with Global-History-Guided Denoising Models	Dec 12, 2023	DenoisingDiversity	—Unverified	0
DiffMorpher: Unleashing the Capability of Diffusion Models for Image Morphing	Dec 12, 2023	Image GenerationImage Morphing	CodeCode Available	2
Boosting Latent Diffusion with Flow Matching	Dec 12, 2023	DecoderDiversity	CodeCode Available	2
Image Content Generation with Causal Reasoning	Dec 12, 2023	Image GenerationQuestion Answering	CodeCode Available	0
Learned representation-guided diffusion models for large-image generation	Dec 12, 2023	Image GenerationSelf-Supervised Learning	CodeCode Available	1
How Well Does GPT-4V(ision) Adapt to Distribution Shifts? A Preliminary Investigation	Dec 12, 2023	Anomaly DetectionAutonomous Driving	CodeCode Available	1
Characteristic Guidance: Non-linear Correction for Diffusion Model at Large Guidance Scale	Dec 11, 2023	DenoisingImage Generation	CodeCode Available	1
User Friendly and Adaptable Discriminative AI: Using the Lessons from the Success of LLMs and Image Generation Models	Dec 11, 2023	Image Generationobject-detection	—Unverified	0
Stellar: Systematic Evaluation of Human-Centric Personalized Text-to-Image Methods	Dec 11, 2023	Image GenerationText to Image Generation	—Unverified	0
Invariant Representation via Decoupling Style and Spurious Features from Images	Dec 11, 2023	Image GenerationRepresentation Learning	—Unverified	0
UIEDP:Underwater Image Enhancement with Diffusion Prior	Dec 11, 2023	Image EnhancementImage Generation	CodeCode Available	1
PortraitBooth: A Versatile Portrait Model for Fast Identity-preserved Personalization	Dec 11, 2023	DiversityFace Recognition	—Unverified	0
Semantic Image Synthesis for Abdominal CT	Dec 11, 2023	Data AugmentationImage Generation	—Unverified	0

Show:10 25 50

← PrevPage 60 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified