Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4651–4700 of 6689 papers

Title	Date	Tasks	Status
On the Adversarial Robustness of Generative Autoencoders in the Latent Space	Jul 5, 2023	Adversarial Robustnesscompressed sensing	—Unverified
Training Energy-Based Models with Diffusion Contrastive Divergences	Jul 4, 2023	DenoisingImage Denoising	—Unverified
Interpretable Computer Vision Models through Adversarial Training: Unveiling the Robustness-Interpretability Connection	Jul 4, 2023	Feature ImportanceImage Generation	CodeCode Available
AdAM: Few-Shot Image Generation via Adaptation-Aware Kernel Modulation	Jul 4, 2023	Domain AdaptationImage Generation	—Unverified
Squeezing Large-Scale Diffusion Models for Mobile	Jul 3, 2023	Image Generation	—Unverified
Investigating Data Memorization in 3D Latent Diffusion Models for Medical Image Synthesis	Jul 3, 2023	Contrastive LearningImage Generation	—Unverified
LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance	Jul 2, 2023	Image Generation	—Unverified
DreamIdentity: Improved Editability for Efficient Face-identity Preserved Image Generation	Jul 1, 2023	Image Generation	—Unverified
Facial Image Generation from Bangla Textual Description using DCGAN and Bangla FastText	Jul 1, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available
Counting Guidance for High Fidelity Text-to-Image Synthesis	Jun 30, 2023	DenoisingImage Generation	—Unverified
Stay on topic with Classifier-Free Guidance	Jun 30, 2023	Code GenerationCommon Sense Reasoning	—Unverified
CLIPAG: Towards Generator-Free Text-to-Image Generation	Jun 29, 2023	image-classificationImage Classification	—Unverified
Approximated Prompt Tuning for Vision-Language Pre-trained Models	Jun 27, 2023	image-classificationImage Classification	—Unverified
Semi-supervised Multimodal Representation Learning through a Global Workspace	Jun 27, 2023	Image CaptioningImage Generation	CodeCode Available
A-STAR: Test-time Attention Segregation and Retention for Text-to-image Synthesis	Jun 26, 2023	AllDenoising	—Unverified
Localized Text-to-Image Generation for Free via Cross Attention Control	Jun 26, 2023	Image GenerationSemantic Segmentation	—Unverified
DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image Generation using Limited Data	Jun 25, 2023	DenoisingDiversity	CodeCode Available
UAlberta at SemEval-2023 Task 1: Context Augmentation and Translation for Multilingual Visual Word Sense Disambiguation	Jun 24, 2023	Image GenerationImage Segmentation	CodeCode Available
A New Paradigm for Generative Adversarial Networks based on Randomized Decision Rules	Jun 23, 2023	ClusteringGenerative Adversarial Network	CodeCode Available
Zero-shot spatial layout conditioning for text-to-image diffusion models	Jun 23, 2023	Image GenerationSegmentation	—Unverified
Directional diffusion models for graph representation learning	Jun 22, 2023	3D Molecule GenerationDenoising	—Unverified
DreamEdit: Subject-driven Image Editing	Jun 22, 2023	Image GenerationPosition	—Unverified
DreamTime: An Improved Optimization Strategy for Diffusion-Guided 3D Generation	Jun 21, 2023	3D GenerationDiversity	—Unverified
TauPETGen: Text-Conditional Tau PET Image Synthesis Based on Latent Diffusion Models	Jun 21, 2023	Image Generation	—Unverified
Chili Pepper Disease Diagnosis via Image Reconstruction Using GrabCut and Generative Adversarial Serial Autoencoder	Jun 21, 2023	Anomaly DetectionImage Generation	—Unverified
The Cultivated Practices of Text-to-Image Generation	Jun 20, 2023	Image GenerationPrompt Engineering	—Unverified
Align, Adapt and Inject: Sound-guided Unified Image Generation	Jun 20, 2023	Image GenerationRetrieval	—Unverified
Learning Profitable NFT Image Diffusions via Multiple Visual-Policy Guided Reinforcement Learning	Jun 20, 2023	AttributeImage Generation	—Unverified
Self-supervised Multi-task Learning Framework for Safety and Health-Oriented Connected Driving Environment Perception using Onboard Camera	Jun 20, 2023	Depth EstimationImage Generation	—Unverified
Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis	Jun 20, 2023	De-identificationImage Generation	—Unverified
Conditional Text Image Generation with Diffusion Models	Jun 19, 2023	DiversityDomain Adaptation	—Unverified
Unsupervised Text Embedding Space Generation Using Generative Adversarial Networks for Text Synthesis	Jun 19, 2023	Image GenerationMemorization	CodeCode Available
GD-VDM: Generated Depth for better Diffusion-based Video Generation	Jun 19, 2023	Image GenerationVideo Generation	CodeCode Available
Graph Self-Supervised Learning for Endoscopic Image Matching	Jun 19, 2023	Anomaly LocalizationImage Generation	CodeCode Available
Referenceless User Controllable Semantic Image Synthesis	Jun 18, 2023	Image Generation	CodeCode Available
Drag-guided diffusion models for vehicle image generation	Jun 16, 2023	DenoisingImage Generation	—Unverified
Prompt Performance Prediction for Image Generation	Jun 15, 2023	Image GenerationImage Retrieval	—Unverified
DiffAug: A Diffuse-and-Denoise Augmentation for Training Robust Classifiers	Jun 15, 2023	DenoisingImage Generation	—Unverified
DreamHuman: Animatable 3D Avatars from Text	Jun 15, 2023	Image GenerationText to 3D	—Unverified
OT-Net: A Reusable Neural Optimal Transport Solver	Jun 14, 2023	Domain AdaptationImage Generation	—Unverified
Perceptions and Realities of Text-to-Image Generation	Jun 14, 2023	Image GenerationText to Image Generation	—Unverified
GBSD: Generative Bokeh with Stage Diffusion	Jun 14, 2023	Image GenerationImage Manipulation	—Unverified
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing	Jun 14, 2023	Image GenerationVideo Editing	—Unverified
Paste, Inpaint and Harmonize via Denoising: Subject-Driven Image Editing with Pre-Trained Diffusion Model	Jun 13, 2023	DenoisingImage Generation	—Unverified
Generative Watermarking Against Unauthorized Subject-Driven Image Synthesis	Jun 13, 2023	Image Generation	—Unverified
AniFaceDrawing: Anime Portrait Exploration during Your Sketching	Jun 13, 2023	Conditional Image GenerationDisentanglement	—Unverified
Parametric Implicit Face Representation for Audio-Driven Facial Reenactment	Jun 13, 2023	Data AugmentationImage Generation	—Unverified
Learning Unnormalized Statistical Models via Compositional Optimization	Jun 13, 2023	Density EstimationImage Generation	—Unverified
Fast Diffusion Model	Jun 12, 2023	Image Generationmodel	CodeCode Available
Fill-Up: Balancing Long-Tailed Data with Generative Models	Jun 12, 2023	Image Generation	—Unverified

Show:10 25 50

← PrevPage 94 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified