Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 6689 papers

Title	Date	Tasks	Status	Hype
Chili Pepper Disease Diagnosis via Image Reconstruction Using GrabCut and Generative Adversarial Serial Autoencoder	Jun 21, 2023	Anomaly DetectionImage Generation	—Unverified	0
DreamTime: An Improved Optimization Strategy for Diffusion-Guided 3D Generation	Jun 21, 2023	3D GenerationDiversity	—Unverified	0
TauPETGen: Text-Conditional Tau PET Image Synthesis Based on Latent Diffusion Models	Jun 21, 2023	Image Generation	—Unverified	0
Self-supervised Multi-task Learning Framework for Safety and Health-Oriented Connected Driving Environment Perception using Onboard Camera	Jun 20, 2023	Depth EstimationImage Generation	—Unverified	0
Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis	Jun 20, 2023	De-identificationImage Generation	—Unverified	0
Masked Diffusion Models Are Fast Distribution Learners	Jun 20, 2023	DenoisingImage Generation	CodeCode Available	1
Align, Adapt and Inject: Sound-guided Unified Image Generation	Jun 20, 2023	Image GenerationRetrieval	—Unverified	0
The Cultivated Practices of Text-to-Image Generation	Jun 20, 2023	Image GenerationPrompt Engineering	—Unverified	0
Learning Profitable NFT Image Diffusions via Multiple Visual-Policy Guided Reinforcement Learning	Jun 20, 2023	AttributeImage Generation	—Unverified	0
Unsupervised Text Embedding Space Generation Using Generative Adversarial Networks for Text Synthesis	Jun 19, 2023	Image GenerationMemorization	CodeCode Available	0
Conditional Text Image Generation with Diffusion Models	Jun 19, 2023	DiversityDomain Adaptation	—Unverified	0
Graph Self-Supervised Learning for Endoscopic Image Matching	Jun 19, 2023	Anomaly LocalizationImage Generation	CodeCode Available	0
GD-VDM: Generated Depth for better Diffusion-based Video Generation	Jun 19, 2023	Image GenerationVideo Generation	CodeCode Available	0
MARBLE: Music Audio Representation Benchmark for Universal Evaluation	Jun 18, 2023	Image GenerationInformation Retrieval	CodeCode Available	1
Point-Cloud Completion with Pretrained Text-to-image Diffusion Models	Jun 18, 2023	Image GenerationPoint Cloud Completion	CodeCode Available	1
Referenceless User Controllable Semantic Image Synthesis	Jun 18, 2023	Image Generation	CodeCode Available	0
Energy-Based Cross Attention for Bayesian Context Update in Text-to-Image Diffusion Models	Jun 16, 2023	DenoisingImage Generation	CodeCode Available	1
Drag-guided diffusion models for vehicle image generation	Jun 16, 2023	DenoisingImage Generation	—Unverified	0
Linguistic Binding in Diffusion Models: Enhancing Attribute Correspondence through Attention Map Alignment	Jun 15, 2023	AttributeImage Generation	CodeCode Available	1
DreamHuman: Animatable 3D Avatars from Text	Jun 15, 2023	Image GenerationText to 3D	—Unverified	0
Contrasting Intra-Modal and Ranking Cross-Modal Hard Negatives to Enhance Visio-Linguistic Compositional Understanding	Jun 15, 2023	Contrastive Learningimage-classification	CodeCode Available	1
DiffAug: A Diffuse-and-Denoise Augmentation for Training Robust Classifiers	Jun 15, 2023	DenoisingImage Generation	—Unverified	0
Prompt Performance Prediction for Image Generation	Jun 15, 2023	Image GenerationImage Retrieval	—Unverified	0
Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text-to-Image Synthesis	Jun 15, 2023	Image GenerationPreference Mapping	CodeCode Available	2
Norm-guided latent space exploration for text-to-image generation	Jun 14, 2023	Image GenerationLong-tail Learning	CodeCode Available	1
Training-free Diffusion Model Adaptation for Variable-Sized Text-to-Image Synthesis	Jun 14, 2023	Image Generation	CodeCode Available	1
Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation	Jun 14, 2023	DenoisingImage Generation	CodeCode Available	1
On the Robustness of Latent Diffusion Models	Jun 14, 2023	DenoisingImage Generation	CodeCode Available	1
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing	Jun 14, 2023	Image GenerationVideo Editing	—Unverified	0
OT-Net: A Reusable Neural Optimal Transport Solver	Jun 14, 2023	Domain AdaptationImage Generation	—Unverified	0
Perceptions and Realities of Text-to-Image Generation	Jun 14, 2023	Image GenerationText to Image Generation	—Unverified	0
GBSD: Generative Bokeh with Stage Diffusion	Jun 14, 2023	Image GenerationImage Manipulation	—Unverified	0
AniFaceDrawing: Anime Portrait Exploration during Your Sketching	Jun 13, 2023	Conditional Image GenerationDisentanglement	—Unverified	0
Generative Watermarking Against Unauthorized Subject-Driven Image Synthesis	Jun 13, 2023	Image Generation	—Unverified	0
Parametric Implicit Face Representation for Audio-Driven Facial Reenactment	Jun 13, 2023	Data AugmentationImage Generation	—Unverified	0
Paste, Inpaint and Harmonize via Denoising: Subject-Driven Image Editing with Pre-Trained Diffusion Model	Jun 13, 2023	DenoisingImage Generation	—Unverified	0
Learning Unnormalized Statistical Models via Compositional Optimization	Jun 13, 2023	Density EstimationImage Generation	—Unverified	0
Fill-Up: Balancing Long-Tailed Data with Generative Models	Jun 12, 2023	Image Generation	—Unverified	0
AI-Generated Image Detection using a Cross-Attention Enhanced Dual-Stream Network	Jun 12, 2023	Image GenerationText to Image Generation	CodeCode Available	1
Fast Diffusion Model	Jun 12, 2023	Image Generationmodel	CodeCode Available	0
Happy People -- Image Synthesis as Black-Box Optimization Problem in the Discrete Latent Space of Deep Generative Models	Jun 11, 2023	Drug DesignImage Generation	—Unverified	0
Face0: Instantaneously Conditioning a Text-to-Image Model on a Face	Jun 11, 2023	Consistent Character GenerationImage Generation	—Unverified	0
Learning Joint Latent Space EBM Prior Model for Multi-layer Generator	Jun 10, 2023	Image GenerationOutlier Detection	—Unverified	0
Image Vectorization: a Review	Jun 10, 2023	Image GenerationVector Graphics	CodeCode Available	5
Beyond Surface Statistics: Scene Representations in a Latent Diffusion Model	Jun 9, 2023	DenoisingImage Generation	CodeCode Available	1
Ownership Protection of Generative Adversarial Networks	Jun 8, 2023	Image GenerationModel extraction	—Unverified	0
Gradient-Informed Quality Diversity for the Illumination of Discrete Spaces	Jun 8, 2023	DiversityDrug Discovery	—Unverified	0
Unsupervised Compositional Concepts Discovery with Text-to-Image Generative Models	Jun 8, 2023	Image Generation	—Unverified	0
Multi-Architecture Multi-Expert Diffusion Models	Jun 8, 2023	DenoisingImage Generation	—Unverified	0
IFaceUV: Intuitive Motion Facial Image Generation by Identity Preservation via UV map	Jun 8, 2023	Image Generation	—Unverified	0

Show:10 25 50

← PrevPage 74 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified