Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3251–3300 of 6689 papers

Title	Date	Tasks	Status
On the Wasserstein Convergence and Straightness of Rectified Flow	Oct 19, 2024	DenoisingImage Generation	CodeCode Available
Truncated Consistency Models	Oct 18, 2024	DenoisingImage Generation	—Unverified
SYNOSIS: Image synthesis pipeline for machine vision in metal surface inspection	Oct 18, 2024	Dataset GenerationDiversity	—Unverified
Parallel Backpropagation for Inverse of a Convolution with Application to Normalizing Flows	Oct 18, 2024	DeblurringGPU	CodeCode Available
Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion	Oct 18, 2024	Conditional Image GenerationImage Generation	—Unverified
FashionR2R: Texture-preserving Rendered-to-Real Image Translation with Diffusion Models	Oct 18, 2024	Image Generation	—Unverified
Assessing Open-world Forgetting in Generative Image Model Customization	Oct 18, 2024	Image Generationzero-shot-classification	—Unverified
CFTS-GAN: Continual Few-Shot Teacher Student for Generative Adversarial Networks	Oct 17, 2024	Continual LearningDiversity	—Unverified
Boosting Imperceptibility of Stable Diffusion-based Adversarial Examples Generation with Momentum	Oct 17, 2024	Image GenerationSemantic Similarity	CodeCode Available
Deep Generative Models Unveil Patterns in Medical Images Through Vision-Language Conditioning	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available
GraspDiffusion: Synthesizing Realistic Whole-body Hand-Object Interaction	Oct 17, 2024	Human-Object Interaction DetectionImage Generation	—Unverified
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model	Oct 17, 2024	Disease PredictionGenerative Adversarial Network	—Unverified
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning	Oct 17, 2024	image-classificationImage Classification	CodeCode Available
MagicTailor: Component-Controllable Personalization in Text-to-Image Diffusion Models	Oct 17, 2024	Image Generation	—Unverified
On the Relation Between Linear Diffusion and Power Iteration	Oct 16, 2024	DenoisingImage Generation	—Unverified
Stable Diffusion with Continuous-time Neural Network	Oct 16, 2024	DenoisingImage Generation	—Unverified
Facing Identity: The Formation and Performance of Identity via Face-Based Artificial Intelligence Technologies	Oct 16, 2024	Image Generation	—Unverified
FaceChain-FACT: Face Adapter with Decoupled Training for Identity-preserved Personalization	Oct 16, 2024	DiversityImage Generation	—Unverified
Evaluating Utility of Memory Efficient Medical Image Generation: A Study on Lung Nodule Segmentation	Oct 16, 2024	DenoisingImage Generation	—Unverified
A Simple Approach to Unifying Diffusion-based Conditional Generation	Oct 15, 2024	Image Generation	—Unverified
DiffGAN: A Test Generation Approach for Differential Testing of Deep Neural Networks	Oct 15, 2024	DiversityGenerative Adversarial Network	—Unverified
InvSeg: Test-Time Prompt Inversion for Semantic Segmentation	Oct 15, 2024	Image GenerationOpen Vocabulary Semantic Segmentation	—Unverified
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling	Oct 15, 2024	Conditional Image GenerationImage Generation	—Unverified
KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities	Oct 15, 2024	Image GenerationRetrieval	—Unverified
Evolutionary Retrofitting	Oct 15, 2024	Code TranslationImage Generation	—Unverified
Vision-guided and Mask-enhanced Adaptive Denoising for Prompt-based Image Editing	Oct 14, 2024	DenoisingImage Generation	CodeCode Available
Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations	Oct 14, 2024	Image Generation	—Unverified
How to Backdoor Consistency Models?	Oct 14, 2024	Image GenerationSpecificity	CodeCode Available
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models	Oct 14, 2024	GPUImage Generation	—Unverified
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling	Oct 14, 2024	DenoisingImage Generation	—Unverified
Saliency Guided Optimization of Diffusion Latents	Oct 14, 2024	global-optimizationImage Generation	—Unverified
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective	Oct 14, 2024	cross-modal alignmentImage Generation	CodeCode Available
Two-Stage Approach for Brain MR Image Synthesis: 2D Image Synthesis and 3D Refinement	Oct 14, 2024	Brain Tumor SegmentationImage Generation	—Unverified
Generating Intermediate Representations for Compositional Text-To-Image Generation	Oct 13, 2024	Image GenerationText to Image Generation	CodeCode Available
EBDM: Exemplar-guided Image Translation with Brownian-bridge Diffusion Models	Oct 13, 2024	Conditional Image GenerationImage Generation	—Unverified
Multi class activity classification in videos using Motion History Image generation	Oct 13, 2024	Action ClassificationAction Recognition	CodeCode Available
DuoDiff: Accelerating Diffusion Models with a Dual-Backbone Approach	Oct 12, 2024	DenoisingImage Generation	CodeCode Available
Score Neural Operator: A Generative Model for Learning and Generalizing Across Multiple Probability Distributions	Oct 11, 2024	Few-Shot LearningImage Generation	—Unverified
Diffusion Models Need Visual Priors for Image Generation	Oct 11, 2024	Image Generation	—Unverified
RealEra: Semantic-level Concept Erasure via Neighbor-Concept Mining	Oct 11, 2024	Image GenerationSpecificity	—Unverified
One-shot Generative Domain Adaptation in 3D GANs	Oct 11, 2024	Domain AdaptationImage Generation	CodeCode Available
Scaling Laws For Diffusion Transformers	Oct 10, 2024	Image GenerationText to Image Generation	—Unverified
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models	Oct 10, 2024	Image GenerationLanguage Modeling	—Unverified
Data Augmentation for Surgical Scene Segmentation with Anatomy-Aware Diffusion Models	Oct 10, 2024	AnatomyData Augmentation	CodeCode Available
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation	Oct 10, 2024	DenoisingImage Generation	—Unverified
FLIER: Few-shot Language Image Models Embedded with Latent Representations	Oct 10, 2024	Image Generation	—Unverified
A Unified Debiasing Approach for Vision-Language Models across Modalities and Tasks	Oct 10, 2024	FairnessImage Captioning	CodeCode Available
Relational Diffusion Distillation for Efficient Image Generation	Oct 10, 2024	Image GenerationKnowledge Distillation	CodeCode Available
On the Solution of Linearized Inverse Scattering Problems in Near-Field Microwave Imaging by Operator Inversion and Matched Filtering	Oct 9, 2024	Image Generation	—Unverified
Boosting Few-Shot Detection with Large Language Models and Layout-to-Image Synthesis	Oct 9, 2024	Image GenerationLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 66 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified