Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 6689 papers

Title	Date	Tasks	Status	Hype
Source Prompt Disentangled Inversion for Boosting Image Editability with Diffusion Models	Mar 17, 2024	Image Generation	CodeCode Available	1
Giving a Hand to Diffusion Models: a Two-Stage Approach to Improving Conditional Human Image Generation	Mar 15, 2024	AnatomyImage Generation	CodeCode Available	1
Towards Unified Multi-Modal Personalization: Large Vision-Language Models for Generative Recommendation and Beyond	Mar 15, 2024	Explanation GenerationImage Generation	CodeCode Available	1
Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing	Mar 14, 2024	Image Generationtext-guided-image-editing	CodeCode Available	1
Counterfactual contrastive learning: robust representations via causal image synthesis	Mar 14, 2024	Contrastive Learningcounterfactual	CodeCode Available	1
SSM Meets Video Diffusion Models: Efficient Long-Term Video Generation with Structured State Spaces	Mar 12, 2024	GPUImage Generation	CodeCode Available	1
Enhancing Semantic Fidelity in Text-to-Image Synthesis: Attention Regulation in Diffusion Models	Mar 11, 2024	Image Generation	CodeCode Available	1
Distribution-Aware Data Expansion with Diffusion Models	Mar 11, 2024	Image GenerationInformativeness	CodeCode Available	1
PEPSI: Pathology-Enhanced Pulse-Sequence-Invariant Representations for Brain MRI	Mar 10, 2024	AnatomyImage Generation	CodeCode Available	1
Privacy-Preserving Diffusion Model Using Homomorphic Encryption	Mar 9, 2024	DenoisingImage Generation	CodeCode Available	1
PromptCharm: Text-to-Image Generation through Multi-modal Prompting and Refinement	Mar 6, 2024	Image GenerationImage Inpainting	CodeCode Available	1
FLAME Diffuser: Wildfire Image Synthesis using Mask Guided Diffusion	Mar 6, 2024	Fire DetectionImage Generation	CodeCode Available	1
PLACE: Adaptive Layout-Semantic Fusion for Semantic Image Synthesis	Mar 4, 2024	Image Generation	CodeCode Available	1
Leveraging Representations from Intermediate Encoder-blocks for Synthetic Image Detection	Feb 29, 2024	Image GenerationSynthetic Image Detection	CodeCode Available	1
SynArtifact: Classifying and Alleviating Artifacts in Synthetic Images via Vision-Language Model	Feb 28, 2024	Image GenerationLanguage Modeling	CodeCode Available	1
FineDiffusion: Scaling up Diffusion Models for Fine-grained Image Generation with 10,000 Classes	Feb 28, 2024	Conditional Image GenerationImage Generation	CodeCode Available	1
One-Shot Structure-Aware Stylized Image Synthesis	Feb 27, 2024	Image GenerationImage Stylization	CodeCode Available	1
Accelerating Diffusion Sampling with Optimized Time Steps	Feb 27, 2024	Image Generation	CodeCode Available	1
NocPlace: Nocturnal Visual Place Recognition via Generative and Inherited Knowledge Transfer	Feb 27, 2024	Image GenerationImage-to-Image Translation	CodeCode Available	1
Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis	Feb 26, 2024	Conditional Image GenerationImage Generation	CodeCode Available	1
SRNDiff: Short-term Rainfall Nowcasting with Condition Diffusion Model	Feb 21, 2024	DecoderDenoising	CodeCode Available	1
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples	Feb 20, 2024	counterfactualData Augmentation	CodeCode Available	1
TC-DiffRecon: Texture coordination MRI reconstruction method based on diffusion model and modified MF-UNet method	Feb 17, 2024	Image GenerationMRI Reconstruction	CodeCode Available	1
Fundamental Benefit of Alternating Updates in Minimax Optimization	Feb 16, 2024	Image Generation	CodeCode Available	1
Accelerating Parallel Sampling of Diffusion Models	Feb 15, 2024	Image Generation	CodeCode Available	1
Social Reward: Evaluating and Enhancing Generative AI through Million-User Feedback from an Online Creative Community	Feb 15, 2024	Image Generation	CodeCode Available	1
Textual Localization: Decomposing Multi-concept Images for Subject-Driven Text-to-Image Generation	Feb 15, 2024	Image GenerationText to Image Generation	CodeCode Available	1
Switch EMA: A Free Lunch for Better Flatness and Sharpness	Feb 14, 2024	Attributeimage-classification	CodeCode Available	1
Adversarial Nibbler: An Open Red-Teaming Method for Identifying Diverse Harms in Text-to-Image Generation	Feb 14, 2024	Image GenerationRed Teaming	CodeCode Available	1
ColorSwap: A Color and Word Order Dataset for Multimodal Evaluation	Feb 7, 2024	Image GenerationImage-text matching	CodeCode Available	1
Noise Map Guidance: Inversion with Spatial Context for Real Image Editing	Feb 7, 2024	Image Generation	CodeCode Available	1
IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images	Feb 5, 2024	Image GenerationImage Harmonization	CodeCode Available	1
Diffusion Cross-domain Recommendation	Feb 3, 2024	Image GenerationRecommendation Systems	CodeCode Available	1
On the Multi-modal Vulnerability of Diffusion Models	Feb 2, 2024	Adversarial AttackImage Generation	CodeCode Available	1
Can MLLMs Perform Text-to-Image In-Context Learning?	Feb 2, 2024	Image GenerationImage to text	CodeCode Available	1
Through-Wall Imaging based on WiFi Channel State Information	Jan 30, 2024	Image GenerationImage Reconstruction	CodeCode Available	1
Repositioning the Subject within Image	Jan 30, 2024	Image GenerationImage Inpainting	CodeCode Available	1
GEM: Boost Simple Network for Glass Surface Segmentation via Segment Anything Model and Data Synthesis	Jan 27, 2024	DecoderImage Generation	CodeCode Available	1
Taiyi-Diffusion-XL: Advancing Bilingual Text-to-Image Generation with Large Vision-Language Model Support	Jan 26, 2024	Image GenerationLanguage Modeling	CodeCode Available	1
Learning to Manipulate Artistic Images	Jan 25, 2024	Computational EfficiencyFeature Compression	CodeCode Available	1
BootPIG: Bootstrapping Zero-shot Personalized Image Generation Capabilities in Pretrained Diffusion Models	Jan 25, 2024	Image GenerationImage Segmentation	CodeCode Available	1
CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion	Jan 25, 2024	Image GenerationStyle Transfer	CodeCode Available	1
DDMI: Domain-Agnostic Latent Diffusion Models for Synthesizing High-Quality Implicit Neural Representations	Jan 23, 2024	3D Shape GenerationImage Generation	CodeCode Available	1
MITS-GAN: Safeguarding Medical Imaging from Tampering with Generative Adversarial Networks	Jan 17, 2024	Image Generation	CodeCode Available	1
Revealing Vulnerabilities in Stable Diffusion via Targeted Attacks	Jan 16, 2024	Adversarial AttackImage Generation	CodeCode Available	1
Deep Linear Array Pushbroom Image Restoration: A Degradation Pipeline and Jitter-Aware Restoration Network	Jan 16, 2024	Image GenerationImage Restoration	CodeCode Available	1
Connect, Collapse, Corrupt: Learning Cross-Modal Tasks with Uni-Modal Data	Jan 16, 2024	Image GenerationText to Image Generation	CodeCode Available	1
HieraFashDiff: Hierarchical Fashion Design with Multi-stage Diffusion Models	Jan 15, 2024	Fashion SynthesisImage Generation	CodeCode Available	1
Quantum Denoising Diffusion Models	Jan 13, 2024	DenoisingImage Generation	CodeCode Available	1
Erasing Undesirable Influence in Diffusion Models	Jan 11, 2024	DenoisingImage Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 22 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified