Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 6689 papers

Title	Date	Tasks	Status	Hype
Towards More Accurate Fake Detection on Images Generated from Advanced Generative and Neural Rendering Models	Nov 13, 2024	Image GenerationNeural Rendering	—Unverified	0
Physics Informed Distillation for Diffusion Models	Nov 13, 2024	Dataset GenerationImage Generation	CodeCode Available	2
A Survey on Vision Autoregressive Model	Nov 13, 2024	3D GenerationBenchmarking	—Unverified	0
Mediffusion: Joint Diffusion for Self-Explainable Semi-Supervised Classification and Medical Image Generation	Nov 12, 2024	counterfactualImage Generation	—Unverified	0
TIPO: Text to Image with Text Presampling for Prompt Optimization	Nov 12, 2024	Image GenerationLanguage Modeling	CodeCode Available	2
Latent Space Disentanglement in Diffusion Transformers Enables Precise Zero-shot Semantic Editing	Nov 12, 2024	DisentanglementImage Generation	—Unverified	0
Emotion Classification of Children Expressions	Nov 12, 2024	ClassificationData Augmentation	—Unverified	0
Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution	Nov 12, 2024	Image Generation	—Unverified	0
Evaluating the Generation of Spatial Relations in Text and Image Generative Models	Nov 12, 2024	BenchmarkingImage Generation	—Unverified	0
Leveraging Previous Steps: A Training-free Fast Solver for Flow Diffusion	Nov 12, 2024	Image GenerationText to Image Generation	—Unverified	0
Exploring Variational Autoencoders for Medical Image Generation: A Comprehensive Study	Nov 11, 2024	Data AugmentationDiversity	—Unverified	0
ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis	Nov 11, 2024	Image Generation	CodeCode Available	1
Layout Control and Semantic Guidance with Attention Loss Backward for T2I Diffusion Model	Nov 11, 2024	AttributeImage Generation	—Unverified	0
Token Merging for Training-Free Semantic Binding in Text-to-Image Synthesis	Nov 11, 2024	AttributeImage Generation	CodeCode Available	2
Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models	Nov 11, 2024	4kImage Generation	—Unverified	0
More Expressive Attention with Negative Weights	Nov 11, 2024	DecoderImage Generation	CodeCode Available	0
DDIM-Driven Coverless Steganography Scheme with Real Key	Nov 10, 2024	DenoisingImage Generation	—Unverified	0
Region-Aware Text-to-Image Generation via Hard Binding and Soft Refinement	Nov 10, 2024	AttributeImage Generation	CodeCode Available	4
PointCG: Self-supervised Point Cloud Learning via Joint Completion and Generation	Nov 9, 2024	DecoderImage Generation	—Unverified	0
Scalable, Tokenization-Free Diffusion Model Architectures with Efficient Initial Convolution and Fixed-Size Reusable Structures for On-Device Image Generation	Nov 9, 2024	Conditional Image GenerationImage Generation	—Unverified	0
Autoregressive Models in Vision: A Survey	Nov 8, 2024	3D GenerationImage Generation	CodeCode Available	4
Improving image synthesis with diffusion-negative sampling	Nov 8, 2024	Image Generation	—Unverified	0
Image2Text2Image: A Novel Framework for Label-Free Evaluation of Image-to-Text Generation with Text-to-Image Diffusion Models	Nov 8, 2024	Image CaptioningImage Generation	—Unverified	0
Precision or Recall? An Analysis of Image Captions for Training Text-to-Image Generation Model	Nov 7, 2024	Image CaptioningImage Generation	CodeCode Available	0
Conditional Diffusion Model for Longitudinal Medical Image Generation	Nov 7, 2024	Image GenerationMedical Image Generation	—Unverified	0
AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation	Nov 7, 2024	Conditional Image GenerationImage Generation	—Unverified	0
Diff-2-in-1: Bridging Generation and Dense Perception with Diffusion Models	Nov 7, 2024	Data AugmentationDenoising	—Unverified	0
DomainGallery: Few-shot Domain-driven Image Generation by Attribute-centric Finetuning	Nov 7, 2024	AttributeDisentanglement	CodeCode Available	0
BendVLM: Test-Time Debiasing of Vision-Language Embeddings	Nov 7, 2024	AttributeImage Generation	CodeCode Available	0
Image Understanding Makes for A Good Tokenizer for Image Generation	Nov 7, 2024	Image Generation	CodeCode Available	1
Taming Rectified Flow for Inversion and Editing	Nov 7, 2024	Image GenerationText-to-Image Generation	CodeCode Available	4
Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models	Nov 7, 2024	Image Generation	CodeCode Available	5
SEE-DPO: Self Entropy Enhanced Direct Preference Optimization	Nov 6, 2024	DiversityImage Generation	—Unverified	0
DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation	Nov 6, 2024	Image GenerationInductive Bias	CodeCode Available	1
ParaGAN: A Scalable Distributed Training Framework for Generative Adversarial Networks	Nov 6, 2024	Image Generation	—Unverified	0
Enhancing Weakly Supervised Semantic Segmentation for Fibrosis via Controllable Image Generation	Nov 5, 2024	Image GenerationSemantic Segmentation	—Unverified	0
Textual Aesthetics in Large Language Models	Nov 5, 2024	Image Generation	CodeCode Available	0
DiT4Edit: Diffusion Transformer for Image Editing	Nov 5, 2024	Image Generation	—Unverified	0
On Improved Conditioning Mechanisms and Pre-training Strategies for Diffusion Models	Nov 5, 2024	Image GenerationText to Image Generation	—Unverified	0
BrainBits: How Much of the Brain are Generative Reconstruction Methods Using?	Nov 5, 2024	Image Generation	—Unverified	0
Gradient-Guided Conditional Diffusion Models for Private Image Reconstruction: Analyzing Adversarial Impacts of Differential Privacy and Denoising	Nov 5, 2024	DenoisingImage Generation	—Unverified	0
Training-free Regional Prompting for Diffusion Transformers	Nov 4, 2024	Image GenerationText to Image Generation	CodeCode Available	4
Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach	Nov 3, 2024	Image GenerationObject	CodeCode Available	0
DPCL-Diff: The Temporal Knowledge Graph Reasoning Based on Graph Node Diffusion Model with Dual-Domain Periodic Contrastive Learning	Nov 3, 2024	Contrastive LearningImage Generation	—Unverified	0
DreamPolish: Domain Score Distillation With Progressive Geometry Generation	Nov 3, 2024	3D GenerationImage Generation	—Unverified	0
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models	Nov 2, 2024	Image DescriptionImage Generation	—Unverified	0
Advancements in Data Processing and Calibration for the Hyperspectral Imaging Satellite (HySIS)	Nov 1, 2024	Earth ObservationImage Generation	—Unverified	0
Generative AI-based Pipeline Architecture for Increasing Training Efficiency in Intelligent Weed Control Systems	Nov 1, 2024	Data AugmentationDomain Adaptation	—Unverified	0
Evaluation Metric for Quality Control and Generative Models in Histopathology Images	Nov 1, 2024	Image Generation	—Unverified	0
Randomized Autoregressive Visual Generation	Nov 1, 2024	Image GenerationLanguage Modeling	CodeCode Available	5

Show:10 25 50

← PrevPage 28 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified