Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 6689 papers

Title	Date	Tasks	Status	Hype
Masked and Adaptive Transformer for Exemplar Based Image Translation	Mar 30, 2023	Image GenerationSemantic correspondence	CodeCode Available	1
Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models	Mar 30, 2023	DisentanglementImage Generation	CodeCode Available	1
WordStylist: Styled Verbatim Handwritten Text Generation with Latent Diffusion Models	Mar 29, 2023	Data AugmentationDenoising	CodeCode Available	1
MDP: A Generalized Framework for Text-Guided Image Editing by Manipulating the Diffusion Path	Mar 29, 2023	Image Generationtext-guided-image-editing	CodeCode Available	1
Fully Hyperbolic Convolutional Neural Networks for Computer Vision	Mar 28, 2023	Image ClassificationImage Generation	CodeCode Available	1
SynthRAD2023 Grand Challenge dataset: generating synthetic CT for radiotherapy	Mar 28, 2023	Computed Tomography (CT)Image Generation	CodeCode Available	1
Memory-Efficient 3D Denoising Diffusion Models for Medical Image Processing	Mar 27, 2023	DenoisingImage Generation	CodeCode Available	1
Freestyle Layout-to-Image Synthesis	Mar 25, 2023	image-classificationImage Classification	CodeCode Available	1
CoLa-Diff: Conditional Latent Diffusion Model for Multi-Modal MRI Synthesis	Mar 24, 2023	CoLAImage Generation	CodeCode Available	1
UrbanGIRAFFE: Representing Urban Scenes as Compositional Generative Neural Feature Fields	Mar 24, 2023	3D-Aware Image SynthesisImage Generation	CodeCode Available	1
Efficient Scale-Invariant Generator with Column-Row Entangled Pixel Synthesis	Mar 24, 2023	2kImage Generation	CodeCode Available	1
High Fidelity Image Synthesis With Deep VAEs In Latent Space	Mar 23, 2023	Image GenerationVocal Bursts Intensity Prediction	CodeCode Available	1
End-to-End Diffusion Latent Optimization Improves Classifier Guidance	Mar 23, 2023	DenoisingImage Generation	CodeCode Available	1
Set-the-Scene: Global-Local Training for Generating Controllable NeRF Scenes	Mar 23, 2023	Image GenerationNeRF	CodeCode Available	1
Medical diffusion on a budget: Textual Inversion for medical image generation	Mar 23, 2023	Diagnosticdomain classification	CodeCode Available	1
NeRF-GAN Distillation for Efficient 3D-Aware Generation with Convolutions	Mar 22, 2023	Image GenerationInductive Bias	CodeCode Available	1
Feature-Conditioned Cascaded Video Diffusion Models for Precise Echocardiogram Synthesis	Mar 22, 2023	Image GenerationVideo Generation	CodeCode Available	1
TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation with Question Answering	Mar 21, 2023	4kImage Generation	CodeCode Available	1
MAGVLT: Masked Generative Vision-and-Language Transformer	Mar 21, 2023	Image CaptioningImage Generation	CodeCode Available	1
Polynomial Implicit Neural Representations For Large Diverse Datasets	Mar 20, 2023	Conditional Image GenerationImage Generation	CodeCode Available	1
Localizing Object-level Shape Variations with Text-to-Image Diffusion Models	Mar 20, 2023	DenoisingImage Generation	CodeCode Available	1
Object-Centric Slot Diffusion	Mar 20, 2023	Image GenerationImage Segmentation	CodeCode Available	1
Discovering Interpretable Directions in the Semantic Latent Space of Diffusion Models	Mar 20, 2023	AttributeDenoising	CodeCode Available	1
Denoising Diffusion Autoencoders are Unified Self-supervised Learners	Mar 17, 2023	Contrastive LearningDenoising	CodeCode Available	1
GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation	Mar 17, 2023	DecoderImage Generation	CodeCode Available	1
Efficient Diffusion Training via Min-SNR Weighting Strategy	Mar 16, 2023	DenoisingImage Generation	CodeCode Available	1
P+: Extended Textual Conditioning in Text-to-Image Generation	Mar 16, 2023	DenoisingImage Generation	CodeCode Available	1
SpectralCLIP: Preventing Artifacts in Text-Guided Style Transfer from a Spectral Perspective	Mar 16, 2023	Image GenerationStyle Transfer	CodeCode Available	1
Improving 3D Imaging with Pre-Trained Perpendicular 2D Diffusion Models	Mar 15, 2023	compressed sensingImage Generation	CodeCode Available	1
MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language Knowledge	Mar 15, 2023	Action RecognitionFew-Shot action recognition	CodeCode Available	1
SelfPromer: Self-Prompt Dehazing Transformers with Depth-Consistency	Mar 13, 2023	Image DehazingImage Generation	CodeCode Available	1
EHRDiff: Exploring Realistic EHR Synthesis with Diffusion Models	Mar 10, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available	1
TrojDiff: Trojan Attacks on Diffusion Models with Diverse Targets	Mar 10, 2023	Image Generation	CodeCode Available	1
Multilevel Diffusion: Infinite Dimensional Score-Based Diffusion Models for Image Generation	Mar 8, 2023	Image Generation	CodeCode Available	1
Vector Quantized Time Series Generation with a Bidirectional Prior Model	Mar 8, 2023	Image GenerationQuantization	CodeCode Available	1
Transformer-based Image Generation from Scene Graphs	Mar 8, 2023	Image GenerationImage Generation from Scene Graphs	CodeCode Available	1
Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles	Mar 7, 2023	Image Generationreinforcement-learning	CodeCode Available	1
Learning multi-scale local conditional probability models of images	Mar 6, 2023	DenoisingImage Generation	CodeCode Available	1
Few-Shot Defect Image Generation via Defect-Aware Feature Manipulation	Mar 4, 2023	Data AugmentationImage Generation	CodeCode Available	1
Dense Pixel-to-Pixel Harmonization via Continuous Image Representation	Mar 3, 2023	Image GenerationImage Harmonization	CodeCode Available	1
A Complete Recipe for Diffusion Generative Models	Mar 3, 2023	Image Generation	CodeCode Available	1
ConTEXTual Net: A Multimodal Vision-Language Model for Segmentation of Pneumothorax	Mar 2, 2023	DescriptiveImage Captioning	CodeCode Available	1
Single Image Backdoor Inversion via Robust Smoothed Classifiers	Mar 1, 2023	Adversarial RobustnessImage Generation	CodeCode Available	1
Continuous-Time Functional Diffusion Processes	Mar 1, 2023	Image Generation	CodeCode Available	1
Dissolving Is Amplifying: Towards Fine-Grained Anomaly Detection	Feb 28, 2023	Anomaly DetectionContrastive Learning	CodeCode Available	1
BrainCLIP: Bridging Brain and Visual-Linguistic Representation Via CLIP for Generic Natural Visual Stimulus Decoding	Feb 25, 2023	Brain DecodingImage Generation	CodeCode Available	1
ArtiFact: A Large-Scale Dataset with Artificial and Factual Images for Generalizable and Robust Synthetic Image Detection	Feb 23, 2023	Image GenerationMulti-class Classification	CodeCode Available	1
Teaching CLIP to Count to Ten	Feb 23, 2023	counterfactualImage Generation	CodeCode Available	1
Reduce, Reuse, Recycle: Compositional Generation with Energy-Based Diffusion Models and MCMC	Feb 22, 2023	Image GenerationText to Image Generation	CodeCode Available	1
Prompt Stealing Attacks Against Text-to-Image Generation Models	Feb 20, 2023	Image GenerationText to Image Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 29 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified