Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 6689 papers

Title	Date	Tasks	Status
High-Fidelity Diffusion-based Image Editing	Dec 25, 2023	DenoisingImage Generation	—Unverified
Make-A-Character: High Quality Text-to-3D Character Generation within Minutes	Dec 24, 2023	3D GenerationImage Generation	—Unverified
Semantic Draw Engineering for Text-to-Image Creation	Dec 23, 2023	Computational EfficiencyImage Generation	—Unverified
Prompt-Propose-Verify: A Reliable Hand-Object-Interaction Data Generation Framework using Foundational Models	Dec 23, 2023	Image GenerationObject	—Unverified
Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training	Dec 23, 2023	Image Generationreinforcement-learning	CodeCode Available
Generative AI and the History of Architecture	Dec 22, 2023	Image Generation	—Unverified
Asymmetric Bias in Text-to-Image Generation with Adversarial Attacks	Dec 22, 2023	Image GenerationText to Image Generation	CodeCode Available
Synthesizing Environment-Specific People in Photographs	Dec 22, 2023	Human ParsingImage Generation	—Unverified
Emage: Non-Autoregressive Text-to-Image Generation	Dec 22, 2023	DenoisingGPU	—Unverified
DreamTuner: Single Image is Enough for Subject-Driven Generation	Dec 21, 2023	Image GenerationText to Image Generation	—Unverified
Fine-grained Forecasting Models Via Gaussian Process Blurring Effect	Dec 21, 2023	DenoisingImage Generation	CodeCode Available
Diff-Oracle: Deciphering Oracle Bone Scripts with Controllable Diffusion Model	Dec 21, 2023	Image GenerationImage-to-Image Translation	—Unverified
All but One: Surgical Concept Erasing with Model Preservation in Text-to-Image Diffusion Models	Dec 20, 2023	AllImage Generation	—Unverified
Conditional Image Generation with Pretrained Generative Model	Dec 20, 2023	Conditional Image GenerationImage Generation	—Unverified
Unlocking Pre-trained Image Backbones for Semantic Image Synthesis	Dec 20, 2023	Conditional Image Generationimage-classification	—Unverified
A self-attention-based differentially private tabular GAN with high data utility	Dec 20, 2023	Generative Adversarial NetworkImage Generation	—Unverified
Surf-CDM: Score-Based Surface Cold-Diffusion Model For Medical Image Segmentation	Dec 19, 2023	DenoisingImage Denoising	—Unverified
Prompting Hard or Hardly Prompting: Prompt Inversion for Text-to-Image Diffusion Models	Dec 19, 2023	Image GenerationPrompt Engineering	—Unverified
Unified framework for diffusion generative models in SO(3): applications in computer vision and astrophysics	Dec 18, 2023	AstronomyDenoising	—Unverified
MagicScroll: Nontypical Aspect-Ratio Image Generation for Visual Storytelling via Multi-Layered Semantic-Aware Denoising	Dec 18, 2023	DenoisingImage Generation	—Unverified
The Right Losses for the Right Gains: Improving the Semantic Consistency of Deep Text-to-Image Generation with Distribution-Sensitive Losses	Dec 18, 2023	Contrastive LearningImage Generation	—Unverified
DeepArt: A Benchmark to Advance Fidelity Research in AI-Generated Content	Dec 16, 2023	Image GenerationLanguage Modeling	CodeCode Available
Operator-learning-inspired Modeling of Neural Ordinary Differential Equations	Dec 16, 2023	image-classificationImage Classification	—Unverified
Tell Me What You See: Text-Guided Real-World Image Denoising	Dec 15, 2023	DenoisingImage Denoising	—Unverified
Towards the Unification of Generative and Discriminative Visual Foundation Model: A Survey	Dec 15, 2023	Image GenerationImage Segmentation	—Unverified
Local Conditional Controlling for Text-to-Image Diffusion Models	Dec 14, 2023	Image Generation	—Unverified
PI3D: Efficient Text-to-3D Generation with Pseudo-Image Diffusion	Dec 14, 2023	3D GenerationImage Generation	—Unverified
ArchiGuesser -- AI Art Architecture Educational Game	Dec 14, 2023	Board GamesDiversity	CodeCode Available
VideoLCM: Video Latent Consistency Model	Dec 14, 2023	Computational EfficiencyImage Generation	—Unverified
ZeroRF: Fast Sparse View 360° Reconstruction with Zero Pretraining	Dec 14, 2023	Image GenerationNeRF	—Unverified
Color Agnostic Cross-Spectral Disparity Estimation	Dec 14, 2023	Disparity EstimationImage Generation	CodeCode Available
VaLID: Variable-Length Input Diffusion for Novel View Synthesis	Dec 14, 2023	Image GenerationNovel View Synthesis	—Unverified
ArcGAN: Generative Adversarial Networks for 3D Architectural Image Generation	Dec 14, 2023	3D Architecture3D Depth Estimation	—Unverified
Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time	Dec 14, 2023	Image GenerationMachine Translation	CodeCode Available
LIME: Localized Image Editing via Attention Regularization in Diffusion Models	Dec 14, 2023	DenoisingImage Generation	—Unverified
FineControlNet: Fine-level Text Control for Image Generation with Spatially Aligned Text Control Injection	Dec 14, 2023	Image Generation	—Unverified
DreamDrone: Text-to-Image Diffusion Models are Zero-shot Perpetual View Generators	Dec 14, 2023	Image GenerationPerpetual View Generation	—Unverified
ρ-Diffusion: A diffusion-based density estimation framework for computational physics	Dec 13, 2023	DenoisingDensity Estimation	CodeCode Available
SEEAvatar: Photorealistic Text-to-3D Avatar Generation with Constrained Geometry and Appearance	Dec 13, 2023	Image GenerationPrompt Engineering	—Unverified
SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models	Dec 13, 2023	Image Generation	—Unverified
Time Series Diffusion Method: A Denoising Diffusion Probabilistic Model for Vibration Signal Generation	Dec 13, 2023	DenoisingFault Diagnosis	—Unverified
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models	Dec 13, 2023	Image GenerationKnowledge Distillation	—Unverified
Semantic-aware Data Augmentation for Text-to-image Synthesis	Dec 13, 2023	Data AugmentationImage Generation	CodeCode Available
Enhancing CT Image synthesis from multi-modal MRI data based on a multi-task neural network framework	Dec 13, 2023	Image GenerationImage Segmentation	—Unverified
Knowledge-Aware Artifact Image Synthesis with LLM-Enhanced Prompting and Multi-Source Supervision	Dec 13, 2023	Image GenerationText to Image Generation	CodeCode Available
3DGEN: A GAN-based approach for generating novel 3D models from image data	Dec 13, 2023	Game DesignImage Generation	—Unverified
AdapEdit: Spatio-Temporal Guided Adaptive Editing Algorithm for Text-Based Continuity-Sensitive Image Editing	Dec 13, 2023	Image GenerationText to Image Generation	CodeCode Available
Stable Rivers: A Case Study in the Application of Text-to-Image Generative Models for Earth Sciences	Dec 13, 2023	FairnessImage Generation	—Unverified
A Survey of Generative AI for Intelligent Transportation Systems: Road Transportation Perspective	Dec 13, 2023	Decision MakingImage Generation	—Unverified
Diffusion Models Enable Zero-Shot Pose Estimation for Lower-Limb Prosthetic Users	Dec 13, 2023	Image GenerationPose Estimation	—Unverified

Show:10 25 50

← PrevPage 85 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified