Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2800 of 6689 papers

Title	Date	Tasks	Status
Variational Schrödinger Momentum Diffusion	Jan 28, 2025	DenoisingImage Generation	—Unverified
DebiasPI: Inference-time Debiasing by Prompt Iteration of a Text-to-Image Generative Model	Jan 28, 2025	AttributeImage Generation	—Unverified
MetaDecorator: Generating Immersive Virtual Tours through Multimodality	Jan 27, 2025	Image Generation	—Unverified
Slot-Guided Adaptation of Pre-trained Diffusion Models for Object-Centric Learning and Compositional Generation	Jan 27, 2025	Image GenerationObject Discovery	—Unverified
RelightVid: Temporal-Consistent Diffusion Model for Video Relighting	Jan 27, 2025	Image GenerationImage Relighting	—Unverified
LoRA-X: Bridging Foundation Models with Training-Free Cross-Model Adaptation	Jan 27, 2025	Image Generationparameter-efficient fine-tuning	—Unverified
StochSync: Stochastic Diffusion Synchronization for Image Generation in Arbitrary Spaces	Jan 26, 2025	Image Generation	—Unverified
IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting	Jan 26, 2025	Diffusion PersonalizationDiffusion Personalization Tuning Free	CodeCode Available
SQ-DM: Accelerating Diffusion Models with Aggressive Quantization and Temporal Sparsity	Jan 26, 2025	Image GenerationQuantization	—Unverified
Comparative clinical evaluation of "memory-efficient" synthetic 3d generative adversarial networks (gan) head-to-head to state of art: results on computed tomography of the chest	Jan 26, 2025	Image Generation	—Unverified
Enhancing Intent Understanding for Ambiguous prompt: A Human-Machine Co-Adaption Strategy	Jan 25, 2025	Image GenerationLanguage Modeling	—Unverified
"Stones from Other Hills can Polish Jade": Zero-shot Anomaly Image Synthesis via Cross-domain Anomaly Injection	Jan 25, 2025	Anomaly DetectionImage Generation	—Unverified
Fully Guided Neural Schrödinger bridge for Brain MR image synthesis	Jan 24, 2025	Image Generation	—Unverified
Training-Free Style and Content Transfer by Leveraging U-Net Skip Connections in Stable Diffusion 2.*	Jan 24, 2025	Image GenerationStyle Transfer	—Unverified
PAID: A Framework of Product-Centric Advertising Image Design	Jan 24, 2025	Image GenerationLayout Generation	—Unverified
Towards Scalable Topological Regularizers	Jan 24, 2025	Domain AdaptationGPU	—Unverified
PhotoGAN: Generative Adversarial Neural Network Acceleration with Silicon Photonics	Jan 23, 2025	Computational EfficiencyData Augmentation	—Unverified
Binary Diffusion Probabilistic Model	Jan 23, 2025	Blind Face RestorationDenoising	—Unverified
Generating Realistic Forehead-Creases for User Verification via Conditioned Piecewise Polynomial Curves	Jan 23, 2025	DiversityImage Generation	CodeCode Available
A Mutual Information Perspective on Multiple Latent Variable Generative Models for Positive View Generation	Jan 23, 2025	Image GenerationRepresentation Learning	—Unverified
LLM-guided Instance-level Image Manipulation with Diffusion U-Net Cross-Attention Maps	Jan 23, 2025	Image GenerationImage Manipulation	CodeCode Available
MSF: Efficient Diffusion Model Via Multi-Scale Latent Factorize	Jan 23, 2025	Image Generation	—Unverified
IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models	Jan 23, 2025	Depth EstimationImage Generation	CodeCode Available
Triplet Synthesis For Enhancing Composed Image Retrieval via Counterfactual Image Generation	Jan 22, 2025	counterfactualImage Generation	—Unverified
Accelerate High-Quality Diffusion Models with Inner Loop Feedback	Jan 22, 2025	DenoisingImage Generation	—Unverified
Synthetic CT image generation from CBCT: A Systematic Review	Jan 22, 2025	Image GenerationPICO	—Unverified
PreciseCam: Precise Camera Control for Text-to-Image Generation	Jan 22, 2025	Image GenerationPrompt Engineering	—Unverified
Orchid: Image Latent Diffusion for Joint Appearance and Geometry Generation	Jan 22, 2025	3D GenerationImage Generation	—Unverified
LiT: Delving into a Simplified Linear Diffusion Transformer for Image Generation	Jan 22, 2025	Image GenerationKnowledge Distillation	—Unverified
Parallel Sequence Modeling via Generalized Spatial Propagation Network	Jan 21, 2025	16kComputational Efficiency	—Unverified
GPS as a Control Signal for Image Generation	Jan 21, 2025	Image Generation	—Unverified
Bidirectional Brain Image Translation using Transfer Learning from Generic Pre-trained Models	Jan 21, 2025	AnatomyComputed Tomography (CT)	—Unverified
Owls are wise and foxes are unfaithful: Uncovering animal stereotypes in vision-language models	Jan 21, 2025	Image Generation	—Unverified
Expertise elevates AI usage: experimental evidence comparing laypeople and professional artists	Jan 21, 2025	Image GenerationLarge Language Model	CodeCode Available
ComposeAnyone: Controllable Layout-to-Human Generation with Decoupled Multimodal Conditions	Jan 21, 2025	Image Generation	CodeCode Available
Are generative models fair? A study of racial bias in dermatological image generation	Jan 20, 2025	DiversityFairness	—Unverified
Ditto: Accelerating Diffusion Model via Temporal Value Similarity	Jan 20, 2025	Image Generationmodel	—Unverified
Block Flow: Learning Straight Flow on Data Blocks	Jan 20, 2025	DiversityImage Generation	CodeCode Available
Nested Annealed Training Scheme for Generative Adversarial Networks	Jan 20, 2025	DenoisingImage Generation	—Unverified
Know "No'' Better: A Data-Driven Approach for Enhancing Negation Awareness in CLIP	Jan 19, 2025	Image GenerationImage Segmentation	—Unverified
DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency	Jan 17, 2025	DecoderImage Generation	—Unverified
IE-Bench: Advancing the Measurement of Text-Driven Image Editing for Human Perception Alignment	Jan 17, 2025	Image Generation	—Unverified
Physics-informed DeepCT: Sinogram Wavelet Decomposition Meets Masked Diffusion	Jan 17, 2025	Image Generation	CodeCode Available
Dynamic Neural Style Transfer for Artistic Image Generation using VGG19	Jan 16, 2025	Image GenerationStyle Transfer	—Unverified
Learnings from Scaling Visual Tokenizers for Reconstruction and Generation	Jan 16, 2025	DecoderImage Generation	—Unverified
SEAL: Entangled White-box Watermarks on Low-Rank Adaptation	Jan 16, 2025	Image Generation	—Unverified
Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps	Jan 16, 2025	DenoisingImage Generation	—Unverified
SVIA: A Street View Image Anonymization Framework for Self-Driving Applications	Jan 16, 2025	De-identificationImage Generation	CodeCode Available
StereoGen: High-quality Stereo Image Generation from a Single Image	Jan 15, 2025	Depth EstimationImage Generation	—Unverified
Yuan: Yielding Unblemished Aesthetics Through A Unified Network for Visual Imperfections Removal in Generated Images	Jan 15, 2025	Image Generation	CodeCode Available

Show:10 25 50

← PrevPage 56 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified