Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 6689 papers

Title	Date	Tasks	Status	Hype
Partially Conditioned Patch Parallelism for Accelerated Diffusion Model Inference	Dec 4, 2024	DenoisingImage Generation	—Unverified	0
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation	Dec 4, 2024	Image GenerationLarge Language Model	—Unverified	0
Multi-view Image Diffusion via Coordinate Noise and Fourier Attention	Dec 4, 2024	Image GenerationText to Image Generation	—Unverified	0
Flow Matching with General Discrete Paths: A Kinetic-Optimal Perspective	Dec 4, 2024	Image GenerationText Generation	—Unverified	0
ShapeWords: Guiding Text-to-Image Synthesis with 3D Shape-Aware Prompts	Dec 3, 2024	Image Generation	—Unverified	0
SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance	Dec 3, 2024	Image Generation	—Unverified	0
GIST: Towards Photorealistic Style Transfer via Multiscale Geometric Representations	Dec 3, 2024	Image GenerationStyle Transfer	—Unverified	0
Generative Photography: Scene-Consistent Camera Control for Realistic Text-to-Image Synthesis	Dec 3, 2024	Image Generation	CodeCode Available	2
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation	Dec 3, 2024	3D GenerationImage Generation	—Unverified	0
FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation	Dec 3, 2024	Image Generation	—Unverified	0
WEM-GAN: Wavelet transform based facial expression manipulation	Dec 3, 2024	Face RecognitionImage Generation	—Unverified	0
AccDiffusion v2: Towards More Accurate Higher-Resolution Diffusion Extrapolation	Dec 3, 2024	Image GenerationLocal Distortion	CodeCode Available	1
ScImage: How Good Are Multimodal Large Language Models at Scientific Text-to-Image Generation?	Dec 3, 2024	AttributeImage Generation	CodeCode Available	0
Taming Scalable Visual Tokenizer for Autoregressive Image Generation	Dec 3, 2024	Image GenerationImage Reconstruction	CodeCode Available	4
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models	Dec 3, 2024	Image GenerationPosition	CodeCode Available	1
Hierarchical VAE with a Diffusion-based VampPrior	Dec 2, 2024	Density EstimationImage Generation	CodeCode Available	0
Fréchet Radiomic Distance (FRD): A Versatile Metric for Comparing Medical Imaging Datasets	Dec 2, 2024	Computational EfficiencyImage Generation	CodeCode Available	1
MFTF: Mask-free Training-free Object Level Layout Control Diffusion Model	Dec 2, 2024	DenoisingImage Generation	CodeCode Available	0
LoyalDiffusion: A Diffusion Model Guarding Against Data Replication	Dec 2, 2024	Image GenerationMemorization	—Unverified	0
OmniFlow: Any-to-Any Generation with Multi-Modal Rectified Flows	Dec 2, 2024	Audio SynthesisImage Generation	CodeCode Available	2
SerialGen: Personalized Image Generation by First Standardization Then Personalization	Dec 2, 2024	Image GenerationPersonalized Image Generation	—Unverified	0
TinyFusion: Diffusion Transformers Learned Shallow	Dec 2, 2024	Image Generation	CodeCode Available	2
MuLan: Adapting Multilingual Diffusion Models for Hundreds of Languages with Negligible Cost	Dec 2, 2024	Image Generation	CodeCode Available	3
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis	Dec 2, 2024	Image GenerationText to Image Generation	—Unverified	0
World-consistent Video Diffusion with Explicit 3D Modeling	Dec 2, 2024	3D GenerationImage Generation	—Unverified	0
Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation	Dec 2, 2024	DenoisingImage Generation	—Unverified	0
CopyrightShield: Spatial Similarity Guided Backdoor Defense against Copyright Infringement in Diffusion Models	Dec 2, 2024	backdoor defenseImage Generation	—Unverified	0
IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models	Dec 2, 2024	Adversarial RobustnessConditional Image Generation	CodeCode Available	1
Concept Replacer: Replacing Sensitive Concepts in Diffusion Models via Precision Localization	Dec 2, 2024	DenoisingFew-Shot Learning	CodeCode Available	0
X-Prompt: Towards Universal In-Context Image Generation in Auto-Regressive Vision Language Foundation Models	Dec 2, 2024	Image GenerationIn-Context Learning	CodeCode Available	2
TextSSR: Diffusion-based Data Synthesis for Scene Text Recognition	Dec 2, 2024	Image GenerationOptical Character Recognition (OCR)	CodeCode Available	2
Memories of Forgotten Concepts	Dec 1, 2024	Image GenerationText to Image Generation	—Unverified	0
Playable Game Generation	Dec 1, 2024	GPUImage Generation	CodeCode Available	2
CtrlNeRF: The Generative Neural Radiation Fields for the Controllable Synthesis of High-fidelity 3D-Aware Images	Dec 1, 2024	3D geometryImage Generation	—Unverified	0
Learning on Less: Constraining Pre-trained Model Learning for Generalizable Diffusion-Generated Image Detection	Dec 1, 2024	Image GenerationMisinformation	—Unverified	0
AniMer: Animal Pose and Shape Estimation Using Family Aware Transformer	Dec 1, 2024	Conditional Image GenerationContrastive Learning	—Unverified	0
Energy-Based Prior Latent Space Diffusion model for Reconstruction of Lumbar Vertebrae from Thick Slice MRI	Nov 30, 2024	3D ReconstructionImage Generation	CodeCode Available	0
QUOTA: Quantifying Objects with Text-to-Image Models for Any Domain	Nov 29, 2024	Domain GeneralizationImage Generation	—Unverified	0
Opt-In Art: Learning Art Styles Only from Few Examples	Nov 29, 2024	Image GenerationText-to-Image Generation	—Unverified	0
Retrieval-guided Cross-view Image Synthesis	Nov 29, 2024	Contrastive LearningDiversity	—Unverified	0
TexGaussian: Generating High-quality PBR Material via Octree-based 3D Gaussian Splatting	Nov 29, 2024	DenoisingImage Generation	CodeCode Available	2
JetFormer: An Autoregressive Generative Model of Raw Images and Text	Nov 29, 2024	DecoderImage Generation	—Unverified	0
Uniform Attention Maps: Boosting Image Fidelity in Reconstruction and Editing	Nov 29, 2024	Image GenerationImage Reconstruction	CodeCode Available	1
3D-WAG: Hierarchical Wavelet-Guided Autoregressive Generation for High-Fidelity 3D Shapes	Nov 28, 2024	3D Shape ModelingImage Generation	—Unverified	0
Improving Multi-Subject Consistency in Open-Domain Image Generation with Isolation and Reposition Attention	Nov 28, 2024	Image Generation	—Unverified	0
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects	Nov 28, 2024	Image Generation	—Unverified	0
DreamBlend: Advancing Personalized Fine-tuning of Text-to-Image Diffusion Models	Nov 28, 2024	DiversityImage Generation	—Unverified	0
Locally-Focused Face Representation for Sketch-to-Image Generation Using Noise-Induced Refinement	Nov 28, 2024	DecoderGenerative Adversarial Network	—Unverified	0
SOWing Information: Cultivating Contextual Coherence with MLLMs in Image Generation	Nov 28, 2024	DenoisingImage Generation	—Unverified	0
AMO Sampler: Enhancing Text Rendering with Overshooting	Nov 28, 2024	Image GenerationText to Image Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 25 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified