Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4001–4050 of 6689 papers

Title	Date	Tasks	Status
HAIFIT: Human-to-AI Fashion Image Translation	Mar 13, 2024	Image GenerationTranslation	CodeCode Available
VIGFace: Virtual Identity Generation for Privacy-Free Face Recognition	Mar 13, 2024	Data AugmentationFace Recognition	CodeCode Available
An Analysis of Human Alignment of Latent Diffusion Models	Mar 13, 2024	Image GenerationOdd One Out	—Unverified
Iterative Online Image Synthesis via Diffusion Model for Imbalanced Classification	Mar 13, 2024	Classificationimage-classification	—Unverified
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation	Mar 12, 2024	Image GenerationText to Image Generation	—Unverified
Block-wise LoRA: Revisiting Fine-grained LoRA for Effective Personalization and Stylization in Text-to-Image Generation	Mar 12, 2024	Image Generationparameter-efficient fine-tuning	—Unverified
Premonition: Using Generative Models to Preempt Future Data Changes in Continual Learning	Mar 12, 2024	Continual LearningFine-Grained Image Classification	CodeCode Available
BraSyn 2023 challenge: Missing MRI synthesis and the effect of different learning objectives	Mar 12, 2024	Brain Tumor SegmentationDeep Learning	—Unverified
Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings	Mar 12, 2024	Image CaptioningImage Generation	—Unverified
AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production	Mar 12, 2024	Image GenerationRAG	—Unverified
FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation	Mar 11, 2024	AttributeImage Generation	—Unverified
Advancing Text-Driven Chest X-Ray Generation with Policy-Based Reinforcement Learning	Mar 11, 2024	DenoisingDiagnostic	—Unverified
FFAD: A Novel Metric for Assessing Generated Time Series Data Utilizing Fourier Transform and Auto-encoder	Mar 11, 2024	Image GenerationTime Series	—Unverified
DivCon: Divide and Conquer for Progressive Text-to-Image Generation	Mar 11, 2024	Image GenerationLayout-to-Image Generation	—Unverified
Medical Image Synthesis via Fine-Grained Image-Text Alignment and Anatomy-Pathology Prompting	Mar 11, 2024	AnatomyDescriptive	—Unverified
Active Generation for Image Classification	Mar 11, 2024	Active LearningClassification	CodeCode Available
3D-aware Image Generation and Editing with Multi-modal Conditions	Mar 11, 2024	AttributeDisentanglement	—Unverified
Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation	Mar 10, 2024	Anomaly DetectionImage Generation	—Unverified
FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing	Mar 10, 2024	Image GenerationText-to-Video Editing	—Unverified
Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution	Mar 9, 2024	Image GenerationImage Super-Resolution	—Unverified
Diffusion Lens: Interpreting Text Encoders in Text-to-Image Pipelines	Mar 9, 2024	Image GenerationRetrieval	—Unverified
Fine-tuning a Multiple Instance Learning Feature Extractor with Masked Context Modelling and Knowledge Distillation	Mar 8, 2024	Image GenerationKnowledge Distillation	—Unverified
Denoising Autoregressive Representation Learning	Mar 8, 2024	DecoderDenoising	—Unverified
Spectrum Translation for Refinement of Image Generation (STIG) Based on Contrastive Learning and Spectral Filter Profile	Mar 8, 2024	Contrastive LearningFace Swapping	CodeCode Available
Evaluating Text-to-Image Generative Models: An Empirical Study on Human Image Synthesis	Mar 8, 2024	Defect DetectionFairness	CodeCode Available
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation	Mar 8, 2024	ArticlesHallucination	—Unverified
DiffChat: Learning to Chat with Text-to-Image Synthesis Models for Interactive Image Creation	Mar 8, 2024	Image GenerationInstruction Following	—Unverified
A Data Augmentation Pipeline to Generate Synthetic Labeled Datasets of 3D Echocardiography Images using a GAN	Mar 8, 2024	Computed Tomography (CT)Data Augmentation	—Unverified
Synthetic Privileged Information Enhances Medical Image Representation Learning	Mar 8, 2024	Image GenerationMedical Image Analysis	—Unverified
Beyond Finite Data: Towards Data-free Out-of-distribution Generalization via Extrapolation	Mar 8, 2024	Domain GeneralizationImage Generation	—Unverified
Improving Diffusion-Based Generative Models via Approximated Optimal Transport	Mar 8, 2024	Image Generation	CodeCode Available
Towards Effective Usage of Human-Centric Priors in Diffusion Models for Text-based Human Image Generation	Mar 8, 2024	Image Generation	—Unverified
A spatiotemporal style transfer algorithm for dynamic visual stimulus generation	Mar 7, 2024	Image GenerationObject Recognition	—Unverified
Discriminative Probing and Tuning for Text-to-Image Generation	Mar 7, 2024	Image GenerationText to Image Generation	—Unverified
Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer	Mar 6, 2024	Image Generation	—Unverified
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport	Mar 6, 2024	Image Generation	—Unverified
Investigation of the Impact of Synthetic Training Data in the Industrial Application of Terminal Strip Object Detection	Mar 6, 2024	Image Generationobject-detection	—Unverified
Measuring Diversity in Co-creative Image Generation	Mar 6, 2024	DiversityImage Generation	—Unverified
Towards Understanding Cross and Self-Attention in Stable Diffusion for Text-Guided Image Editing	Mar 6, 2024	DenoisingImage Generation	—Unverified
(Un)paired signal-to-signal translation with 1D conditional GANs	Mar 5, 2024	Audio GenerationGenerative Adversarial Network	—Unverified
HanDiffuser: Text-to-Image Generation With Realistic Hand Appearances	Mar 4, 2024	Image GenerationText to Image Generation	—Unverified
AtomoVideo: High Fidelity Image-to-Video Generation	Mar 4, 2024	Image GenerationImage to Video Generation	—Unverified
NiNformer: A Network in Network Transformer with Token Mixing Generated Gating Function	Mar 4, 2024	image-classificationImage Classification	CodeCode Available
Transformer for Times Series: an Application to the S&P500	Mar 4, 2024	Image GenerationTime Series	—Unverified
SCott: Accelerating Diffusion Models with Stochastic Consistency Distillation	Mar 3, 2024	Image GenerationText to Image Generation	—Unverified
Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian Mixture Models	Mar 3, 2024	DiversityImage Generation	—Unverified
Critical windows: non-asymptotic theory for feature emergence in diffusion models	Mar 3, 2024	FairnessImage Generation	—Unverified
Bespoke Non-Stationary Solvers for Fast Sampling of Diffusion and Flow Models	Mar 2, 2024	Audio GenerationConditional Image Generation	—Unverified
TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion	Mar 2, 2024	Image GenerationText to Image Generation	—Unverified
An Ordinal Diffusion Model for Generating Medical Images with Different Severity Levels	Mar 1, 2024	Image GenerationMedical Image Generation	—Unverified

Show:10 25 50

← PrevPage 81 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified