Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5150 of 6689 papers

Title	Date	Tasks	Status
Arbitrary Style Guidance for Enhanced Diffusion-Based Text-to-Image Generation	Nov 14, 2022	DiversityImage Generation	—Unverified
Extreme Generative Image Compression by Learning Text Embedding from Diffusion Models	Nov 14, 2022	Image CompressionImage Generation	—Unverified
Controllable GAN Synthesis Using Non-Rigid Structure-from-Motion	Nov 14, 2022	3D geometry3D Reconstruction	—Unverified
Structural constrained virtual histology staining for human coronary imaging using deep learning	Nov 12, 2022	Image Generation	—Unverified
Physically-Based Face Rendering for NIR-VIS Face Recognition	Nov 11, 2022	Face RecognitionImage Generation	—Unverified
HumanDiffusion: a Coarse-to-Fine Alignment Diffusion Framework for Controllable Text-Driven Person Image Generation	Nov 11, 2022	Image GenerationRetrieval	—Unverified
SSGVS: Semantic Scene Graph-to-Video Synthesis	Nov 11, 2022	Image Generation	—Unverified
Self-conditioned Embedding Diffusion for Text Generation	Nov 8, 2022	Image GenerationLanguage Modeling	—Unverified
Few-shot Image Generation with Diffusion Models	Nov 7, 2022	DenoisingDiversity	CodeCode Available
Easily Accessible Text-to-Image Generation Amplifies Demographic Stereotypes at Large Scale	Nov 7, 2022	Image GenerationText to Image Generation	CodeCode Available
Evaluating a Synthetic Image Dataset Generated with Stable Diffusion	Nov 3, 2022	Data Augmentationimage-classification	—Unverified
Book Cover Synthesis from the Summary	Nov 3, 2022	Image Generation	—Unverified
Generation of Anonymous Chest Radiographs Using Latent Diffusion Models for Training Thoracic Abnormality Classification Systems	Nov 2, 2022	Anomaly DetectionImage Generation	—Unverified
CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Natural Language	Nov 2, 2022	DiversityImage Generation	—Unverified
Spot the fake lungs: Generating Synthetic Medical Images using Neural Diffusion Models	Nov 2, 2022	Image Generation	—Unverified
Synthetic ID Card Image Generation for Improving Presentation Attack Detection	Oct 31, 2022	Fraud DetectionImage Generation	—Unverified
gCoRF: Generative Compositional Radiance Fields	Oct 31, 2022	Image Generation	—Unverified
Recursive Reasoning in Minimax Games: A Level k Gradient Play Method	Oct 29, 2022	GPUImage Generation	CodeCode Available
UPainting: Unified Text-to-Image Diffusion Generation with Cross-modal Guidance	Oct 28, 2022	Image GenerationImage-text matching	—Unverified
Latent Space is Feature Space: Regularization Term for GANs Training on Limited Dataset	Oct 28, 2022	Data AugmentationDiversity	CodeCode Available
ERNIE-ViLG 2.0: Improving Text-to-Image Diffusion Model with Knowledge-Enhanced Mixture-of-Denoising-Experts	Oct 27, 2022	DenoisingImage Generation	CodeCode Available
Accelerating Diffusion Models via Pre-segmentation Diffusion Sampling for Medical Image Segmentation	Oct 27, 2022	Conditional Image GenerationDenoising	—Unverified
A Generic Shared Attention Mechanism for Various Backbone Neural Networks	Oct 27, 2022	Data Augmentationimage-classification	—Unverified
ScoreMix: A Scalable Augmentation Strategy for Training GANs with Limited Data	Oct 27, 2022	Data AugmentationDiversity	—Unverified
Few-shot Image Generation via Masked Discrimination	Oct 27, 2022	DiversityImage Generation	CodeCode Available
SSD: Towards Better Text-Image Consistency Metric in Text-to-Image Generation	Oct 27, 2022	Image GenerationSemantic Similarity	CodeCode Available
Towards Practicality of Sketch-Based Visual Understanding	Oct 27, 2022	Image GenerationImage Retrieval	—Unverified
Lafite2: Few-shot Text-to-Image Generation	Oct 25, 2022	Image GenerationRetrieval	—Unverified
Learning Latent Structural Causal Models	Oct 24, 2022	Bayesian InferenceImage Generation	—Unverified
Photo-realistic Neural Domain Randomization	Oct 23, 2022	Depth EstimationImage Generation	—Unverified
Diffusion Motion: Generate Text-Guided 3D Human Motion by Diffusion Model	Oct 22, 2022	DenoisingImage Generation	—Unverified
A Visual Tour Of Current Challenges In Multimodal Language Models	Oct 22, 2022	Image GenerationText to Image Generation	—Unverified
Instance-Aware Image Completion	Oct 22, 2022	Image Generationobject-detection	—Unverified
Efficient Hair Style Transfer with Generative Adversarial Networks	Oct 22, 2022	Image GenerationStyle Transfer	—Unverified
Z-LaVI: Zero-Shot Language Solver Fueled by Visual Imagination	Oct 21, 2022	Image GenerationLanguage Modeling	CodeCode Available
Stochastic Adaptive Activation Function	Oct 21, 2022	Image Generation	CodeCode Available
Composing Ensembles of Pre-trained Models via Iterative Consensus	Oct 20, 2022	Arithmetic ReasoningImage Generation	—Unverified
Backdoor Attack and Defense in Federated Generative Adversarial Network-based Medical Image Synthesis	Oct 19, 2022	Backdoor AttackData Augmentation	—Unverified
Swinv2-Imagen: Hierarchical Vision Transformer Diffusion Models for Text-to-Image Generation	Oct 18, 2022	Image GenerationLanguage Modelling	—Unverified
Improving GANs with a Feature Cycling Generator	Oct 18, 2022	Image Generation	—Unverified
From Play to Policy: Conditional Behavior Generation from Uncurated Robot Data	Oct 18, 2022	Image Generation	—Unverified
A Patch-Based Algorithm for Diverse and High Fidelity Single Image Generation	Oct 16, 2022	DiversityImage Generation	CodeCode Available
DiffGAR: Model-Agnostic Restoration from Generative Artifacts Using Image-to-Image Diffusion Models	Oct 16, 2022	Image GenerationImage Restoration	—Unverified
Character-Centric Story Visualization via Visual Planning and Token Alignment	Oct 16, 2022	Image GenerationStory Visualization	CodeCode Available
LAION-5B: An open large-scale dataset for training next generation image-text models	Oct 16, 2022	Image GenerationPreference Mapping	CodeCode Available
DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models	Oct 13, 2022	AttributeFake Image Detection	—Unverified
BLADERUNNER: Rapid Countermeasure for Synthetic (AI-Generated) StyleGAN Faces	Oct 12, 2022	Image Generation	CodeCode Available
FontTransformer: Few-shot High-resolution Chinese Glyph Image Synthesis via Stacked Transformers	Oct 12, 2022	Few-Shot LearningFont Generation	—Unverified
Style-Guided Inference of Transformer for High-resolution Image Synthesis	Oct 11, 2022	Image GenerationVocal Bursts Intensity Prediction	—Unverified
Controllable Radiance Fields for Dynamic Face Synthesis	Oct 11, 2022	3D-Aware Image SynthesisFace Generation	—Unverified

Show:10 25 50

← PrevPage 103 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified