Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4451–4500 of 6689 papers

Title	Date	Tasks	Status
Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers	Oct 9, 2023	Image GenerationImage Reconstruction	—Unverified
X-Transfer: A Transfer Learning-Based Framework for GAN-Generated Fake Image Detection	Oct 7, 2023	Fake Image DetectionImage Generation	—Unverified
BrainSCUBA: Fine-Grained Natural Language Captions of Visual Cortex Selectivity	Oct 6, 2023	Image GenerationLanguage Modeling	—Unverified
Observation-Guided Diffusion Probabilistic Models	Oct 6, 2023	DenoisingImage Generation	CodeCode Available
Assessing Robustness via Score-Based Adversarial Image Generation	Oct 6, 2023	Image Generation	—Unverified
Robustness-Guided Image Synthesis for Data-Free Quantization	Oct 5, 2023	Data Free QuantizationDiversity	—Unverified
RL-based Stateful Neural Adaptive Sampling and Denoising for Real-Time Path Tracing	Oct 5, 2023	DenoisingImage Generation	CodeCode Available
Leveraging Unpaired Data for Vision-Language Generative Models via Cycle Consistency	Oct 5, 2023	Image GenerationImage to text	—Unverified
GETAvatar: Generative Textured Meshes for Animatable Human Avatars	Oct 4, 2023	Image Generation	—Unverified
ED-NeRF: Efficient Text-Guided Editing of 3D Scene with Latent Space NeRF	Oct 4, 2023	DenoisingImage Generation	—Unverified
Boosting Dermatoscopic Lesion Segmentation via Diffusion Models with Visual and Textual Prompts	Oct 4, 2023	Data AugmentationImage Generation	—Unverified
Efficient-3DiM: Learning a Generalizable Single-image Novel-view Synthesizer in One Day	Oct 4, 2023	Image GenerationNovel View Synthesis	—Unverified
Kosmos-G: Generating Images in Context with Multimodal Large Language Models	Oct 4, 2023	DecoderImage Generation	CodeCode Available
Posterior Sampling Based on Gradient Flows of the MMD with Negative Distance Kernel	Oct 4, 2023	Conditional Image GenerationImage Generation	CodeCode Available
GenCO: Generating Diverse Designs with Combinatorial Constraints	Oct 3, 2023	Combinatorial OptimizationImage Generation	—Unverified
TP2O: Creative Text Pair-to-Object Generation using Balance Swap-Sampling	Oct 3, 2023	Image GenerationObject	—Unverified
Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models	Oct 3, 2023	Image GenerationVisual Question Answering (VQA)	CodeCode Available
Predicated Diffusion: Predicate Logic-Based Attention Guidance for Text-to-Image Diffusion Models	Oct 3, 2023	Image Generation	—Unverified
Understanding Transferable Representation Learning and Zero-shot Transfer in CLIP	Oct 2, 2023	Image GenerationRepresentation Learning	—Unverified
Counterfactual Image Generation for adversarially robust and interpretable Classifiers	Oct 1, 2023	counterfactualDescriptive	—Unverified
A Comprehensive Review of Generative AI in Healthcare	Oct 1, 2023	DiagnosticDrug Design	—Unverified
Completing Visual Objects via Bridging Generation and Segmentation	Oct 1, 2023	Image GenerationObject	—Unverified
Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional Image Synthesis	Sep 30, 2023	ColorizationConditional Image Generation	CodeCode Available
Towards Few-Call Model Stealing via Active Self-Paced Knowledge Distillation and Diffusion-Based Image Generation	Sep 29, 2023	Image GenerationKnowledge Distillation	—Unverified
Exposing Image Splicing Traces in Scientific Publications via Uncertainty-guided Refinement	Sep 28, 2023	Image ForensicsImage Generation	CodeCode Available
Teaching Text-to-Image Models to Communicate in Dialog	Sep 27, 2023	Image GenerationSentence	—Unverified
Factorized Diffusion Architectures for Unsupervised Image Generation and Segmentation	Sep 27, 2023	DenoisingImage Generation	—Unverified
Position and Orientation-Aware One-Shot Learning for Medical Action Recognition from Signal Data	Sep 27, 2023	Action RecognitionDynamic Time Warping	—Unverified
Guided Frequency Loss for Image Restoration	Sep 27, 2023	DenoisingImage Generation	—Unverified
Emu: Enhancing Image Generation Models Using Photogenic Needles in a Haystack	Sep 27, 2023	Image Generation	—Unverified
Jointly Training Large Autoregressive Multimodal Models	Sep 27, 2023	Image Generation	—Unverified
DreamCom: Finetuning Text-guided Inpainting Model for Image Composition	Sep 27, 2023	Image GenerationImage Inpainting	—Unverified
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning	Sep 26, 2023	Image GenerationVideo Generation	—Unverified
Text-to-Image Generation for Abstract Concepts	Sep 26, 2023	FormImage Generation	—Unverified
In-Domain GAN Inversion for Faithful Reconstruction and Editability	Sep 25, 2023	Image GenerationImage Reconstruction	—Unverified
Chop & Learn: Recognizing and Generating Object-State Compositions	Sep 25, 2023	Action RecognitionImage Generation	—Unverified
Diverse Semantic Image Editing with Style Codes	Sep 25, 2023	Conditional Image GenerationImage Generation	CodeCode Available
Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion Models	Sep 25, 2023	DenoisingImage Generation	—Unverified
Randomize to Generalize: Domain Randomization for Runway FOD Detection	Sep 23, 2023	Image AugmentationImage Generation	—Unverified
MISFIT-V: Misaligned Image Synthesis and Fusion using Information from Thermal and Visual	Sep 22, 2023	Generative Adversarial NetworkImage Generation	CodeCode Available
TextCLIP: Text-Guided Face Image Generation And Manipulation Without Adversarial Training	Sep 21, 2023	Image GenerationImage Manipulation	—Unverified
Distilling Adversarial Prompts from Safety Benchmarks: Report for the Adversarial Nibbler Challenge	Sep 20, 2023	Image Generation	—Unverified
Understanding Pose and Appearance Disentanglement in 3D Human Pose Estimation	Sep 20, 2023	3D Human Pose EstimationAdversarial Attack	—Unverified
Language-Oriented Communication with Semantic Coding and Knowledge Distillation for Text-to-Image Generation	Sep 20, 2023	Image GenerationIn-Context Learning	—Unverified
Latent Diffusion Models for Structural Component Design	Sep 20, 2023	Image Generation	—Unverified
Assessing the capacity of a denoising diffusion probabilistic model to reproduce spatial context	Sep 19, 2023	Data AugmentationDenoising	—Unverified
SideGAN: 3D-Aware Generative Model for Improved Side-View Image Synthesis	Sep 19, 2023	Image Generation	—Unverified
Language Guided Adversarial Purification	Sep 19, 2023	Adversarial DefenseAdversarial Purification	CodeCode Available
Diffusion Models for Accurate Channel Distribution Generation	Sep 19, 2023	Image GenerationScheduling	—Unverified
Gradpaint: Gradient-Guided Inpainting with Diffusion Models	Sep 18, 2023	DenoisingImage Generation	—Unverified

Show:10 25 50

← PrevPage 90 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified