Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3201–3250 of 6689 papers

Title	Date	Tasks	Status	Hype
3DStyle-Diffusion: Pursuing Fine-grained Text-driven 3D Stylization with 2D Diffusion Models	Nov 9, 2023	Image Generation	CodeCode Available	1
3DGAUnet: 3D generative adversarial networks with a 3D U-Net based generator to achieve the accurate and effective synthesis of clinical tumor image data for pancreatic cancer	Nov 9, 2023	Data AugmentationImage Generation	—Unverified	0
ControlStyle: Text-Driven Stylized Image Generation Using Diffusion Priors	Nov 9, 2023	Image GenerationStyle Transfer	—Unverified	0
ConRad: Image Constrained Radiance Fields for 3D Generation from a Single Image	Nov 9, 2023	3D Generation3D Reconstruction	—Unverified	0
Retinal OCT Synthesis with Denoising Diffusion Probabilistic Models for Layer Segmentation	Nov 9, 2023	DenoisingImage Generation	—Unverified	0
L-WaveBlock: A Novel Feature Extractor Leveraging Wavelets for Generative Adversarial Networks	Nov 9, 2023	DenoisingImage Denoising	—Unverified	0
LCM-LoRA: A Universal Stable-Diffusion Acceleration Module	Nov 9, 2023	GPUImage Generation	CodeCode Available	4
Image-Based Virtual Try-On: A Survey	Nov 8, 2023	Image GenerationSurvey	CodeCode Available	1
Image Generation and Learning Strategy for Deep Document Forgery Detection	Nov 7, 2023	Image GenerationSelf-Supervised Learning	—Unverified	0
SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial Network for an end-to-end image translation	Nov 7, 2023	Contrastive LearningDiversity	—Unverified	0
Reducing Spatial Fitting Error in Distillation of Denoising Diffusion Models	Nov 7, 2023	AttributeDenoising	CodeCode Available	0
LLM as an Art Director (LaDi): Using LLMs to improve Text-to-Media Generators	Nov 7, 2023	Image GenerationRetrieval	—Unverified	0
Energy-Calibrated VAE with Test Time Free Lunch	Nov 7, 2023	Image GenerationImage Restoration	CodeCode Available	0
AnyText: Multilingual Visual Text Generation And Editing	Nov 6, 2023	Image GenerationOptical Character Recognition (OCR)	CodeCode Available	4
SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis	Nov 6, 2023	DiversityImage Generation	—Unverified	0
From Trojan Horses to Castle Walls: Unveiling Bilateral Data Poisoning Effects in Diffusion Models	Nov 4, 2023	Backdoor Attackbackdoor defense	CodeCode Available	0
Stable Diffusion Reference Only: Image Prompt and Blueprint Jointly Guided Multi-Condition Diffusion Model for Secondary Painting	Nov 4, 2023	Image Generation	CodeCode Available	1
PRISM: Progressive Restoration for Scene Graph-based Image Manipulation	Nov 3, 2023	DenoisingDescriptive	—Unverified	0
GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks	Nov 2, 2023	Image GenerationImage to text	—Unverified	0
Towards High-quality HDR Deghosting with Conditional Diffusion Models	Nov 2, 2023	DenoisingImage Generation	—Unverified	0
Mukh-Oboyob: Stable Diffusion and BanglaBERT enhanced Bangla Text-to-Face Synthesis	Nov 1, 2023	Face GenerationImage Generation	CodeCode Available	0
Optimal Budgeted Rejection Sampling for Generative Models	Nov 1, 2023	DiversityImage Generation	—Unverified	0
LLaVA-Interactive: An All-in-One Demo for Image Chat, Segmentation, Generation and Editing	Nov 1, 2023	AllImage Generation	CodeCode Available	4
Adaptive Latent Diffusion Model for 3D Medical Image to Image Translation: Multi-modal Magnetic Resonance Imaging Study	Nov 1, 2023	Image GenerationImage-to-Image Translation	CodeCode Available	1
Flooding Regularization for Stable Training of Generative Adversarial Networks	Nov 1, 2023	Image Generation	—Unverified	0
Diversity and Diffusion: Observations on Synthetic Image Distributions with Stable Diffusion	Oct 31, 2023	DiversityImage Generation	—Unverified	0
HWD: A Novel Evaluation Score for Styled Handwritten Text Generation	Oct 31, 2023	Image GenerationPerceptual Distance	CodeCode Available	1
The Missing U for Efficient Diffusion Models	Oct 31, 2023	DenoisingImage Generation	—Unverified	0
Transformation vs Tradition: Artificial General Intelligence (AGI) for Arts and Humanities	Oct 30, 2023	Image GenerationMarketing	—Unverified	0
IMPRESS: Evaluating the Resilience of Imperceptible Perturbations Against Unauthorized Data Usage in Diffusion-Based Generative AI	Oct 30, 2023	Image Generation	CodeCode Available	1
IterInv: Iterative Inversion for Pixel-Level T2I Models	Oct 30, 2023	Image GenerationSuper-Resolution	CodeCode Available	0
CustomNet: Zero-shot Object Customization with Variable-Viewpoints in Text-to-Image Diffusion Models	Oct 30, 2023	Image GenerationNovel View Synthesis	—Unverified	0
FPGAN-Control: A Controllable Fingerprint Generator for Training with Synthetic Data	Oct 29, 2023	DisentanglementImage Generation	CodeCode Available	1
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image Generation	Oct 27, 2023	Image GenerationQuestion Answering	—Unverified	0
Three-dimensional Bone Image Synthesis with Generative Adversarial Networks	Oct 26, 2023	AttributeImage Generation	—Unverified	0
CADS: Unleashing the Diversity of Diffusion Models through Condition-Annealed Sampling	Oct 26, 2023	AttributeDiversity	—Unverified	0
AntifakePrompt: Prompt-Tuned Vision-Language Models are Fake Image Detectors	Oct 26, 2023	DeepFake DetectionFace Swapping	CodeCode Available	1
DiffS2UT: A Semantic Preserving Diffusion Model for Textless Direct Speech-to-Speech Translation	Oct 26, 2023	Image GenerationSpeech-to-Speech Translation	—Unverified	0
Exploring the Potential of Generative AI for the World Wide Web	Oct 26, 2023	Image Generation	—Unverified	0
UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception	Oct 25, 2023	Data AugmentationImage Generation	—Unverified	0
Local Statistics for Generative Image Detection	Oct 25, 2023	Image GenerationImage Super-Resolution	—Unverified	0
A Picture is Worth a Thousand Words: Principled Recaptioning Improves Image Generation	Oct 25, 2023	Image CaptioningImage Generation	—Unverified	0
Learning Robust Deep Visual Representations from EEG Brain Recordings	Oct 25, 2023	Contrastive LearningEEG	CodeCode Available	1
Interferometric Neural Networks	Oct 25, 2023	AstronomyCombinatorial Optimization	CodeCode Available	0
Integrating View Conditions for Image Synthesis	Oct 24, 2023	Image GenerationObject	CodeCode Available	1
Learning Low-Rank Latent Spaces with Simple Deterministic Autoencoder: Theoretical and Empirical Insights	Oct 24, 2023	Image Generation	CodeCode Available	0
RePoseDM: Recurrent Pose Alignment and Gradient Guidance for Pose Guided Image Synthesis	Oct 24, 2023	Image GenerationPose-Guided Image Generation	—Unverified	0
Complex Image Generation SwinTransformer Network for Audio Denoising	Oct 24, 2023	Audio DenoisingDenoising	CodeCode Available	0
DEsignBench: Exploring and Benchmarking DALL-E 3 for Imagining Visual Design	Oct 23, 2023	BenchmarkingImage Generation	CodeCode Available	0
Matryoshka Diffusion Models	Oct 23, 2023	Image GenerationZero-shot Generalization	CodeCode Available	2

Show:10 25 50

← PrevPage 65 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified