Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3200 of 6689 papers

Title	Date	Tasks	Status
Test-time Conditional Text-to-Image Synthesis Using Diffusion Models	Nov 16, 2024	Conditional Text-to-Image SynthesisDenoising	—Unverified
Visual question answering based evaluation metrics for text-to-image generation	Nov 15, 2024	Image GenerationImage Manipulation	—Unverified
CART: Compositional Auto-Regressive Transformer for Image Generation	Nov 15, 2024	Image GenerationLanguage Modeling	—Unverified
Boundary Attention Constrained Zero-Shot Layout-To-Image Generation	Nov 15, 2024	Image GenerationLayout-to-Image Generation	—Unverified
Adaptive Non-Uniform Timestep Sampling for Diffusion Model Training	Nov 15, 2024	Image GenerationScheduling	—Unverified
Safe Text-to-Image Generation: Simply Sanitize the Prompt Embedding	Nov 15, 2024	Image GenerationText to Image Generation	—Unverified
Content-Aware Preserving Image Generation	Nov 15, 2024	Image GenerationScene Understanding	—Unverified
Advancing Diffusion Models: Alias-Free Resampling and Enhanced Rotational Equivariance	Nov 14, 2024	Computational EfficiencyImage Generation	—Unverified
Image Regeneration: Evaluating Text-to-Image Model via Generating Identical Image with Multimodal Large Language Models	Nov 14, 2024	Image Generation	—Unverified
Towards More Accurate Fake Detection on Images Generated from Advanced Generative and Neural Rendering Models	Nov 13, 2024	Image GenerationNeural Rendering	—Unverified
A Survey on Vision Autoregressive Model	Nov 13, 2024	3D GenerationBenchmarking	—Unverified
Mediffusion: Joint Diffusion for Self-Explainable Semi-Supervised Classification and Medical Image Generation	Nov 12, 2024	counterfactualImage Generation	—Unverified
Latent Space Disentanglement in Diffusion Transformers Enables Precise Zero-shot Semantic Editing	Nov 12, 2024	DisentanglementImage Generation	—Unverified
Leveraging Previous Steps: A Training-free Fast Solver for Flow Diffusion	Nov 12, 2024	Image GenerationText to Image Generation	—Unverified
Evaluating the Generation of Spatial Relations in Text and Image Generative Models	Nov 12, 2024	BenchmarkingImage Generation	—Unverified
Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution	Nov 12, 2024	Image Generation	—Unverified
Emotion Classification of Children Expressions	Nov 12, 2024	ClassificationData Augmentation	—Unverified
Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models	Nov 11, 2024	4kImage Generation	—Unverified
More Expressive Attention with Negative Weights	Nov 11, 2024	DecoderImage Generation	CodeCode Available
Exploring Variational Autoencoders for Medical Image Generation: A Comprehensive Study	Nov 11, 2024	Data AugmentationDiversity	—Unverified
Layout Control and Semantic Guidance with Attention Loss Backward for T2I Diffusion Model	Nov 11, 2024	AttributeImage Generation	—Unverified
DDIM-Driven Coverless Steganography Scheme with Real Key	Nov 10, 2024	DenoisingImage Generation	—Unverified
Scalable, Tokenization-Free Diffusion Model Architectures with Efficient Initial Convolution and Fixed-Size Reusable Structures for On-Device Image Generation	Nov 9, 2024	Conditional Image GenerationImage Generation	—Unverified
PointCG: Self-supervised Point Cloud Learning via Joint Completion and Generation	Nov 9, 2024	DecoderImage Generation	—Unverified
Improving image synthesis with diffusion-negative sampling	Nov 8, 2024	Image Generation	—Unverified
Image2Text2Image: A Novel Framework for Label-Free Evaluation of Image-to-Text Generation with Text-to-Image Diffusion Models	Nov 8, 2024	Image CaptioningImage Generation	—Unverified
AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation	Nov 7, 2024	Conditional Image GenerationImage Generation	—Unverified
DomainGallery: Few-shot Domain-driven Image Generation by Attribute-centric Finetuning	Nov 7, 2024	AttributeDisentanglement	CodeCode Available
Precision or Recall? An Analysis of Image Captions for Training Text-to-Image Generation Model	Nov 7, 2024	Image CaptioningImage Generation	CodeCode Available
Diff-2-in-1: Bridging Generation and Dense Perception with Diffusion Models	Nov 7, 2024	Data AugmentationDenoising	—Unverified
BendVLM: Test-Time Debiasing of Vision-Language Embeddings	Nov 7, 2024	AttributeImage Generation	CodeCode Available
Conditional Diffusion Model for Longitudinal Medical Image Generation	Nov 7, 2024	Image GenerationMedical Image Generation	—Unverified
SEE-DPO: Self Entropy Enhanced Direct Preference Optimization	Nov 6, 2024	DiversityImage Generation	—Unverified
ParaGAN: A Scalable Distributed Training Framework for Generative Adversarial Networks	Nov 6, 2024	Image Generation	—Unverified
Textual Aesthetics in Large Language Models	Nov 5, 2024	Image Generation	CodeCode Available
DiT4Edit: Diffusion Transformer for Image Editing	Nov 5, 2024	Image Generation	—Unverified
BrainBits: How Much of the Brain are Generative Reconstruction Methods Using?	Nov 5, 2024	Image Generation	—Unverified
Gradient-Guided Conditional Diffusion Models for Private Image Reconstruction: Analyzing Adversarial Impacts of Differential Privacy and Denoising	Nov 5, 2024	DenoisingImage Generation	—Unverified
On Improved Conditioning Mechanisms and Pre-training Strategies for Diffusion Models	Nov 5, 2024	Image GenerationText to Image Generation	—Unverified
Enhancing Weakly Supervised Semantic Segmentation for Fibrosis via Controllable Image Generation	Nov 5, 2024	Image GenerationSemantic Segmentation	—Unverified
DreamPolish: Domain Score Distillation With Progressive Geometry Generation	Nov 3, 2024	3D GenerationImage Generation	—Unverified
DPCL-Diff: The Temporal Knowledge Graph Reasoning Based on Graph Node Diffusion Model with Dual-Domain Periodic Contrastive Learning	Nov 3, 2024	Contrastive LearningImage Generation	—Unverified
Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach	Nov 3, 2024	Image GenerationObject	CodeCode Available
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models	Nov 2, 2024	Image DescriptionImage Generation	—Unverified
Advancements in Data Processing and Calibration for the Hyperspectral Imaging Satellite (HySIS)	Nov 1, 2024	Earth ObservationImage Generation	—Unverified
Generative AI-based Pipeline Architecture for Increasing Training Efficiency in Intelligent Weed Control Systems	Nov 1, 2024	Data AugmentationDomain Adaptation	—Unverified
Evaluation Metric for Quality Control and Generative Models in Histopathology Images	Nov 1, 2024	Image Generation	—Unverified
Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy	Oct 31, 2024	Decision MakingDiagnostic	—Unverified
DiffPAD: Denoising Diffusion-based Adversarial Patch Decontamination	Oct 31, 2024	Adversarial RobustnessBinarization	CodeCode Available
Image Synthesis with Class-Aware Semantic Diffusion Models for Surgical Scene Segmentation	Oct 31, 2024	Image GenerationScene Segmentation	—Unverified

Show:10 25 50

← PrevPage 64 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified