Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5051–5100 of 6689 papers

Title	Date	Tasks	Status
Rethinking the Objectives of Vector-Quantized Tokenizers for Image Synthesis	Dec 6, 2022	Conditional Image GenerationDecoder	—Unverified
ADIR: Adaptive Diffusion for Image Reconstruction	Dec 6, 2022	DeblurringDenoising	—Unverified
RANA: Relightable Articulated Neural Avatars	Dec 6, 2022	DisentanglementImage Generation	—Unverified
M-VADER: A Model for Diffusion with Multimodal Context	Dec 6, 2022	DecoderImage Generation	—Unverified
Audio Latent Space Cartography	Dec 5, 2022	Image Generation	—Unverified
MouseGAN++: Unsupervised Disentanglement and Contrastive Representation for Multiple MRI Modalities Synthesis and Structural Segmentation of Mouse Brain	Dec 4, 2022	DisentanglementImage Generation	—Unverified
A Domain-specific Perceptual Metric via Contrastive Self-supervised Representation: Applications on Natural and Medical Images	Dec 3, 2022	Image Generation	—Unverified
Discovering Class-Specific GAN Controls for Semantic Image Synthesis	Dec 2, 2022	Image Generation	—Unverified
3D-LDM: Neural Implicit 3D Shape Generation with Latent Diffusion Models	Dec 1, 2022	3D Generation3D Shape Generation	—Unverified
SparseFusion: Distilling View-conditioned Diffusion for 3D Reconstruction	Dec 1, 2022	3D ReconstructionImage Generation	—Unverified
Deep neural network techniques for monaural speech enhancement: state of the art analysis	Dec 1, 2022	Art AnalysisImage Generation	—Unverified
Weakly Supervised Annotations for Multi-modal Greeting Cards Dataset	Dec 1, 2022	Image CaptioningImage Generation	—Unverified
Generating Realistic Synthetic Relational Data through Graph Variational Autoencoders	Nov 30, 2022	Image GenerationSynthetic Data Generation	—Unverified
3D Neural Field Generation using Triplane Diffusion	Nov 30, 2022	3D GenerationDiversity	—Unverified
SGDraw: Scene Graph Drawing Interface Using Object-Oriented Representation	Nov 30, 2022	Graph GenerationImage Generation	CodeCode Available
High-Fidelity Guided Image Synthesis with Latent Diffusion Models	Nov 30, 2022	Image GenerationVocal Bursts Intensity Prediction	—Unverified
Extracting Semantic Knowledge from GANs with Unsupervised Learning	Nov 30, 2022	Image GenerationImage Segmentation	—Unverified
Dr.3D: Adapting 3D GANs to Artistic Drawings	Nov 30, 2022	Image GenerationPose Estimation	—Unverified
Dimensionality-Varying Diffusion Process	Nov 29, 2022	Image Generation	—Unverified
The Myth of Culturally Agnostic AI Models	Nov 28, 2022	Image GenerationMemorization	—Unverified
Using a Conditional Generative Adversarial Network to Control the Statistical Characteristics of Generated Images for IACT Data Analysis	Nov 28, 2022	AstronomyGenerative Adversarial Network	—Unverified
CLIP2GAN: Towards Bridging Text with the Latent Space of GANs	Nov 28, 2022	AttributeImage Generation	—Unverified
Hand-Object Interaction Image Generation	Nov 28, 2022	Image GenerationObject	—Unverified
Conditional Progressive Generative Adversarial Network for satellite image generation	Nov 28, 2022	Generative Adversarial NetworkImage Generation	—Unverified
Diffusion Probabilistic Model Made Slim	Nov 27, 2022	Image Generationmodel	—Unverified
Traditional Classification Neural Networks are Good Generators: They are Competitive with DDPMs and GANs	Nov 27, 2022	Image GenerationText to Image Generation	—Unverified
Cross-domain Microscopy Cell Counting by Disentangled Transfer Learning	Nov 26, 2022	Image GenerationTransfer Learning	—Unverified
Efficient Video Prediction via Sparsely Conditioned Flow Matching	Nov 26, 2022	Image GenerationPrediction	—Unverified
Unifying conditional and unconditional semantic image synthesis with OCO-GAN	Nov 25, 2022	Image GenerationSemantic Segmentation	—Unverified
SpaText: Spatio-Textual Representation for Controllable Image Generation	Nov 25, 2022	Image GenerationText to Image Generation	—Unverified
Learning Detailed Radiance Manifolds for High-Fidelity and 3D-Consistent Portrait Synthesis from Monocular Image	Nov 25, 2022	Image GenerationNovel View Synthesis	—Unverified
ILSGAN: Independent Layer Synthesis for Unsupervised Foreground-Background Segmentation	Nov 25, 2022	Generative Adversarial NetworkImage Generation	CodeCode Available
Diffusion-SDF: Conditional Generative Modeling of Signed Distance Functions	Nov 24, 2022	Image Generation	—Unverified
More comprehensive facial inversion for more effective expression recognition	Nov 24, 2022	Facial Expression RecognitionFacial Expression Recognition (FER)	CodeCode Available
ReCo: Region-Controlled Text-to-Image Generation	Nov 23, 2022	Conditional Text-to-Image SynthesisImage Generation	—Unverified
CGOF++: Controllable 3D Face Synthesis with Conditional Generative Occupancy Fields	Nov 23, 2022	Face GenerationImage Generation	—Unverified
Retrieval-Augmented Multimodal Language Modeling	Nov 22, 2022	Caption GenerationImage Captioning	—Unverified
Human Evaluation of Text-to-Image Models on a Multi-Task Benchmark	Nov 22, 2022	AttributeImage Generation	—Unverified
Rethinking Implicit Neural Representations for Vision Learners	Nov 22, 2022	image-classificationImage Classification	—Unverified
SceneComposer: Any-Level Semantic Image Synthesis	Nov 21, 2022	Image Generation	—Unverified
VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models	Nov 21, 2022	Image GenerationText to 3D	—Unverified
DreamArtist++: Controllable One-Shot Text-to-Image Generation via Positive-Negative Adapter	Nov 21, 2022	Image GenerationNovel Concepts	—Unverified
TimbreCLIP: Connecting Timbre to Text and Images	Nov 21, 2022	Cross-Modal RetrievalImage Generation	—Unverified
Exploring the Effectiveness of Mask-Guided Feature Modulation as a Mechanism for Localized Style Editing of Real Images	Nov 21, 2022	Image Generation	—Unverified
IC3D: Image-Conditioned 3D Diffusion for Shape Generation	Nov 20, 2022	3D Generation3D Reconstruction	—Unverified
Single Stage Multi-Pose Virtual Try-On	Nov 19, 2022	Image GenerationPose Transfer	—Unverified
Potential Auto-driving Threat: Universal Rain-removal Attack	Nov 18, 2022	Autonomous DrivingImage Generation	—Unverified
UMFuse: Unified Multi View Fusion for Human Editing applications	Nov 17, 2022	Image GenerationRetrieval	—Unverified
A Creative Industry Image Generation Dataset Based on Captions	Nov 16, 2022	Image Generation	—Unverified
Will Large-scale Generative Models Corrupt Future Datasets?	Nov 15, 2022	image-classificationImage Classification	CodeCode Available

Show:10 25 50

← PrevPage 102 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified