Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3601–3650 of 6689 papers

Title	Date	Tasks	Status
Chest-Diffusion: A Light-Weight Text-to-Image Model for Report-to-CXR Generation	Jun 30, 2024	DenoisingImage Generation	—Unverified
BADM: Batch ADMM for Deep Learning	Jun 30, 2024	Deep LearningImage Generation	—Unverified
Efficient Personalized Text-to-image Generation by Leveraging Textual Subspace	Jun 30, 2024	Image GenerationRepresentation Learning	CodeCode Available
The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention	Jun 29, 2024	DiversityImage Generation	CodeCode Available
Toward a Diffusion-Based Generalist for Dense Vision Tasks	Jun 29, 2024	Conditional Image GenerationImage Generation	—Unverified
Wavelets Are All You Need for Autoregressive Image Generation	Jun 28, 2024	AllImage Generation	—Unverified
PopAlign: Population-Level Alignment for Fair Text-to-Image Generation	Jun 28, 2024	Image GenerationText to Image Generation	CodeCode Available
Analyzing Quality, Bias, and Performance in Text-to-Image Generative Models	Jun 28, 2024	Image Generation	—Unverified
How Stable is Stable Diffusion under Recursive InPainting (RIP)?	Jun 27, 2024	Image GenerationText to Image Generation	—Unverified
Diminishing Stereotype Bias in Image Generation Model using Reinforcemenlent Learning Feedback	Jun 27, 2024	DenoisingFairness	—Unverified
DiffLoss: unleashing diffusion model as constraint for training image restoration network	Jun 27, 2024	Image GenerationImage Restoration	CodeCode Available
MultiDiff: Consistent Novel View Synthesis from a Single Image	Jun 26, 2024	Image GenerationNovel View Synthesis	—Unverified
VDG: Vision-Only Dynamic Gaussian for Driving Simulation	Jun 26, 2024	Image Generation	—Unverified
MUMU: Bootstrapping Multimodal Image Generation from Text-to-Image Data	Jun 26, 2024	DecoderGPU	—Unverified
TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification	Jun 25, 2024	image-classificationImage Classification	—Unverified
SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing	Jun 25, 2024	3D scene EditingImage Generation	—Unverified
EvolvED: Evolutionary Embeddings to Understand the Generation Process of Diffusion Models	Jun 25, 2024	AttributeDimensionality Reduction	—Unverified
Masked Generative Extractor for Synergistic Representation and 3D Generation of Point Clouds	Jun 25, 2024	3D GenerationFew-Shot Learning	—Unverified
Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation	Jun 24, 2024	Image GenerationText to Image Generation	—Unverified
ResMaster: Mastering High-Resolution Image Generation via Structural and Fine-Grained Guidance	Jun 24, 2024	4kDenoising	—Unverified
Prompt-Consistency Image Generation (PCIG): A Unified Framework Integrating LLMs, Knowledge Graphs, and Controllable Diffusion Models	Jun 24, 2024	HallucinationImage Generation	CodeCode Available
Repulsive Latent Score Distillation for Solving Inverse Problems	Jun 24, 2024	Computational EfficiencyDiversity	CodeCode Available
Repairing Catastrophic-Neglect in Text-to-Image Diffusion Models via Attention-Guided Feature Enhancement	Jun 24, 2024	Image Generation	CodeCode Available
EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation	Jun 22, 2024	Backdoor AttackDiffusion Personalization	—Unverified
Disability Representations: Finding Biases in Automatic Image Generation	Jun 21, 2024	Image Generation	—Unverified
Backdooring Bias into Text-to-Image Models	Jun 21, 2024	Backdoor AttackImage Generation	CodeCode Available
Latent diffusion models for parameterization and data assimilation of facies-based geomodels	Jun 21, 2024	DenoisingDimensionality Reduction	—Unverified
Video Generation with Learned Action Prior	Jun 20, 2024	Image GenerationImage Reconstruction	—Unverified
Holistic Evaluation for Interleaved Text-and-Image Generation	Jun 20, 2024	Image Generation	—Unverified
CollaFuse: Collaborative Diffusion Models	Jun 20, 2024	Edge-computingFederated Learning	CodeCode Available
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps	Jun 20, 2024	Image GenerationImage Manipulation	—Unverified
What's Next? Exploring Utilization, Challenges, and Future Directions of AI-Generated Image Tools in Graphic Design	Jun 19, 2024	Image Generation	—Unverified
Cyclic 2.5D Perceptual Loss for Cross-Modal 3D Medical Image Synthesis: T1w MRI to Tau PET	Jun 18, 2024	Image GenerationSSIM	CodeCode Available
Training Diffusion Models with Federated Learning	Jun 18, 2024	DenoisingFederated Learning	—Unverified
Generative Visual Instruction Tuning	Jun 17, 2024	Image GenerationImage-text matching	CodeCode Available
Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models	Jun 17, 2024	DecoderImage Generation	—Unverified
GeoGPT4V: Towards Geometric Multi-modal Large Language Models with Geometric Image Generation	Jun 17, 2024	Image GenerationMath	CodeCode Available
PhyBench: A Physical Commonsense Benchmark for Evaluating Text-to-Image Models	Jun 17, 2024	Image Generation	—Unverified
Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes	Jun 17, 2024	Data AugmentationImage Generation	—Unverified
ARTIST: Improving the Generation of Text-rich Images with Disentangled Diffusion Models and Large Language Models	Jun 17, 2024	DisentanglementImage Generation	—Unverified
Decomposed evaluations of geographic disparities in text-to-image models	Jun 17, 2024	AttributeDiversity	—Unverified
Mixture-of-Subspaces in Low-Rank Adaptation	Jun 16, 2024	Common Sense ReasoningImage Generation	CodeCode Available
An Analysis on Quantizing Diffusion Transformers	Jun 16, 2024	Conditional Image GenerationDenoising	—Unverified
MINT: a Multi-modal Image and Narrative Text Dubbing Dataset for Foley Audio Content Planning and Generation	Jun 15, 2024	AudioCapsImage Generation	CodeCode Available
Poetry2Image: An Iterative Correction Framework for Images Generated from Chinese Classical Poetry	Jun 15, 2024	Image GenerationText to Image Generation	—Unverified
Can Generative AI Replace Immunofluorescent Staining Processes? A Comparison Study of Synthetically Generated CellPainting Images from Brightfield	Jun 15, 2024	Image Generation	—Unverified
Crafting Parts for Expressive Object Composition	Jun 14, 2024	DenoisingImage Generation	—Unverified
An Image is Worth More Than 16x16 Patches: Exploring Transformers on Individual Pixels	Jun 13, 2024	Image GenerationInductive Bias	—Unverified
Toffee: Efficient Million-Scale Dataset Construction for Subject-Driven Text-to-Image Generation	Jun 13, 2024	GPUImage Generation	—Unverified
Batch-Instructed Gradient for Prompt Evolution:Systematic Prompt Optimization for Enhanced Text-to-Image Synthesis	Jun 13, 2024	Image GenerationText to Image Generation	CodeCode Available

Show:10 25 50

← PrevPage 73 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified