Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4401–4450 of 6689 papers

Title	Date	Tasks	Status
PRISM: Progressive Restoration for Scene Graph-based Image Manipulation	Nov 3, 2023	DenoisingDescriptive	—Unverified
GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks	Nov 2, 2023	Image GenerationImage to text	—Unverified
Towards High-quality HDR Deghosting with Conditional Diffusion Models	Nov 2, 2023	DenoisingImage Generation	—Unverified
Flooding Regularization for Stable Training of Generative Adversarial Networks	Nov 1, 2023	Image Generation	—Unverified
Mukh-Oboyob: Stable Diffusion and BanglaBERT enhanced Bangla Text-to-Face Synthesis	Nov 1, 2023	Face GenerationImage Generation	CodeCode Available
Optimal Budgeted Rejection Sampling for Generative Models	Nov 1, 2023	DiversityImage Generation	—Unverified
The Missing U for Efficient Diffusion Models	Oct 31, 2023	DenoisingImage Generation	—Unverified
Diversity and Diffusion: Observations on Synthetic Image Distributions with Stable Diffusion	Oct 31, 2023	DiversityImage Generation	—Unverified
CustomNet: Zero-shot Object Customization with Variable-Viewpoints in Text-to-Image Diffusion Models	Oct 30, 2023	Image GenerationNovel View Synthesis	—Unverified
Transformation vs Tradition: Artificial General Intelligence (AGI) for Arts and Humanities	Oct 30, 2023	Image GenerationMarketing	—Unverified
IterInv: Iterative Inversion for Pixel-Level T2I Models	Oct 30, 2023	Image GenerationSuper-Resolution	CodeCode Available
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image Generation	Oct 27, 2023	Image GenerationQuestion Answering	—Unverified
DiffS2UT: A Semantic Preserving Diffusion Model for Textless Direct Speech-to-Speech Translation	Oct 26, 2023	Image GenerationSpeech-to-Speech Translation	—Unverified
Three-dimensional Bone Image Synthesis with Generative Adversarial Networks	Oct 26, 2023	AttributeImage Generation	—Unverified
CADS: Unleashing the Diversity of Diffusion Models through Condition-Annealed Sampling	Oct 26, 2023	AttributeDiversity	—Unverified
Exploring the Potential of Generative AI for the World Wide Web	Oct 26, 2023	Image Generation	—Unverified
Local Statistics for Generative Image Detection	Oct 25, 2023	Image GenerationImage Super-Resolution	—Unverified
A Picture is Worth a Thousand Words: Principled Recaptioning Improves Image Generation	Oct 25, 2023	Image CaptioningImage Generation	—Unverified
UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception	Oct 25, 2023	Data AugmentationImage Generation	—Unverified
Interferometric Neural Networks	Oct 25, 2023	AstronomyCombinatorial Optimization	CodeCode Available
Complex Image Generation SwinTransformer Network for Audio Denoising	Oct 24, 2023	Audio DenoisingDenoising	CodeCode Available
Learning Low-Rank Latent Spaces with Simple Deterministic Autoencoder: Theoretical and Empirical Insights	Oct 24, 2023	Image Generation	CodeCode Available
RePoseDM: Recurrent Pose Alignment and Gradient Guidance for Pose Guided Image Synthesis	Oct 24, 2023	Image GenerationPose-Guided Image Generation	—Unverified
DEsignBench: Exploring and Benchmarking DALL-E 3 for Imagining Visual Design	Oct 23, 2023	BenchmarkingImage Generation	CodeCode Available
Bridging the Gap between Synthetic and Authentic Images for Multimodal Machine Translation	Oct 20, 2023	DecoderImage Generation	CodeCode Available
Localizing and Editing Knowledge in Text-to-Image Generative Models	Oct 20, 2023	AttributeImage Generation	—Unverified
PrivacyGAN: robust generative image privacy	Oct 19, 2023	Data PoisoningImage Generation	—Unverified
STANLEY: Stochastic Gradient Anisotropic Langevin Dynamics for Learning Energy-Based Models	Oct 19, 2023	Image Generation	—Unverified
Conditional Generative Modeling for Images, 3D Animations, and Video	Oct 19, 2023	ArticlesDecoder	—Unverified
Diverse Diffusion: Enhancing Image Diversity in Text-to-Image Generation	Oct 19, 2023	DiversityImage Generation	—Unverified
BiomedJourney: Counterfactual Biomedical Image Generation by Instruction-Learning from Multimodal Patient Journeys	Oct 16, 2023	counterfactualDenoising	—Unverified
ViPE: Visualise Pretty-much Everything	Oct 16, 2023	Caption GenerationFigurative Language Visualization	CodeCode Available
Enhancing ML model accuracy for Digital VLSI circuits using diffusion models: A study on synthetic data generation	Oct 15, 2023	Data AugmentationImage Generation	—Unverified
Unified High-binding Watermark for Unconditional Image Generation Models	Oct 14, 2023	DecoderImage Generation	—Unverified
Discovery and Expansion of New Domains within Diffusion Models	Oct 13, 2023	DenoisingImage Generation	—Unverified
Hypernymy Understanding Evaluation of Text-to-Image Models via WordNet Hierarchy	Oct 13, 2023	Image Generation	CodeCode Available
CopyScope: Model-level Copyright Infringement Quantification in the Diffusion Workflow	Oct 13, 2023	Image Generation	—Unverified
R&B: Region and Boundary Aware Zero-shot Grounded Text-to-image Generation	Oct 13, 2023	Image GenerationText to Image Generation	—Unverified
HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion	Oct 12, 2023	Image Generation	—Unverified
Unmasking Bias in Diffusion Model Training	Oct 12, 2023	DenoisingImage Generation	CodeCode Available
Neural Diffusion Models	Oct 12, 2023	Image Generation	—Unverified
SingleInsert: Inserting New Concepts from a Single Image into Text-to-Image Models for Flexible Editing	Oct 12, 2023	Image GenerationImage to text	—Unverified
Distance Weighted Trans Network for Image Completion	Oct 11, 2023	Image Generation	—Unverified
Multi-Concept T2I-Zero: Tweaking Only The Text Embeddings and Nothing Else	Oct 11, 2023	Image GenerationImage Manipulation	—Unverified
JointNet: Extending Text-to-Image Diffusion for Dense Distribution Modeling	Oct 10, 2023	Depth EstimationDepth Prediction	—Unverified
Improving Compositional Text-to-image Generation with Large Vision-Language Models	Oct 10, 2023	AttributeImage Generation	—Unverified
Learning Stackable and Skippable LEGO Bricks for Efficient, Reconfigurable, and Variable-Resolution Diffusion Modeling	Oct 10, 2023	Image Generation	CodeCode Available
Locality-Aware Generalizable Implicit Neural Representation	Oct 9, 2023	DecoderImage Generation	—Unverified
Perceptual Artifacts Localization for Image Synthesis Tasks	Oct 9, 2023	Image Generation	—Unverified
A Bias-Variance-Covariance Decomposition of Kernel Scores for Generative Models	Oct 9, 2023	Image GenerationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 89 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified