Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 6689 papers

Title	Date	Tasks	Status
AI for Just Work: Constructing Diverse Imaginations of AI beyond "Replacing Humans"	Mar 10, 2025	Image Generation	—Unverified
Synthetic Lung X-ray Generation through Cross-Attention and Affinity Transformation	Mar 10, 2025	Image GenerationMedical Image Analysis	—Unverified
Color Alignment in Diffusion	Mar 9, 2025	DiversityImage Generation	—Unverified
DynamicID: Zero-Shot Multi-ID Image Personalization with Flexible Facial Editability	Mar 9, 2025	Contrastive LearningFacial Editing	—Unverified
ARMOR v0.1: Empowering Autoregressive Multimodal Understanding Model with Interleaved Multimodal Generation via Asymmetric Synergy	Mar 9, 2025	DecoderImage Generation	—Unverified
Towards More Accurate Personalized Image Generation: Addressing Overfitting and Evaluation Bias	Mar 9, 2025	Image GenerationPersonalized Image Generation	CodeCode Available
Adding Additional Control to One-Step Diffusion with Joint Distribution Matching	Mar 9, 2025	Image Generation	—Unverified
Generative modelling with jump-diffusions	Mar 9, 2025	Image Generation	CodeCode Available
PixelPonder: Dynamic Patch Adaptation for Enhanced Multi-Conditional Text-to-Image Generation	Mar 9, 2025	DenoisingImage Generation	—Unverified
TR-DQ: Time-Rotation Diffusion Quantization	Mar 9, 2025	Image GenerationQuantization	—Unverified
Fine-Grained Alignment and Noise Refinement for Compositional Text-to-Image Generation	Mar 9, 2025	AttributeImage Generation	CodeCode Available
Consistent Image Layout Editing with Diffusion Models	Mar 9, 2025	Image Generation	—Unverified
Disrupting Model Merging: A Parameter-Level Defense Without Sacrificing Accuracy	Mar 8, 2025	image-classificationImage Classification	—Unverified
VLForgery Face Triad: Detection, Localization and Attribution via Multimodal Large Language Models	Mar 8, 2025	AttributeDeepFake Detection	—Unverified
Text2Story: Advancing Video Storytelling with Text Guidance	Mar 8, 2025	FormImage Generation	—Unverified
Anti-Diffusion: Preventing Abuse of Modifications of Diffusion-Based Models	Mar 7, 2025	Image Generation	CodeCode Available
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
LapLoss: Laplacian Pyramid-based Multiscale loss for Image Translation	Mar 7, 2025	Image GenerationImage-to-Image Translation	—Unverified
Synthetic Data is an Elegant GIFT for Continual Vision-Language Models	Mar 6, 2025	Continual LearningImage Generation	—Unverified
Energy-Guided Optimization for Personalized Image Editing with Pretrained Text-to-Image Diffusion Models	Mar 6, 2025	Image GenerationObject	—Unverified
Find Matching Faces Based On Face Parameters	Mar 5, 2025	Face DetectionImage Generation	—Unverified
Multi-View Depth Consistent Image Generation Using Generative AI Models: Application on Architectural Design of University Buildings	Mar 5, 2025	Depth EstimationImage Generation	—Unverified
A Generative Approach to High Fidelity 3D Reconstruction from Text Data	Mar 5, 2025	3D ReconstructionImage Generation	—Unverified
Straight-Line Diffusion Model for Efficient 3D Molecular Generation	Mar 4, 2025	3D Molecule GenerationImage Generation	CodeCode Available
Generative Modeling of Microweather Wind Velocities for Urban Air Mobility	Mar 4, 2025	DenoisingImage Generation	CodeCode Available
Q&C: When Quantization Meets Cache in Efficient Image Generation	Mar 4, 2025	Image GenerationQuantization	CodeCode Available
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification	Mar 4, 2025	Image Generation	—Unverified
Teaching Metric Distance to Autoregressive Multimodal Foundational Models	Mar 4, 2025	Image GenerationVisual Grounding	—Unverified
Robust time series generation via Schrödinger Bridge: a comprehensive evaluation	Mar 4, 2025	Image GenerationTime Series	—Unverified
ACCORD: Alleviating Concept Coupling through Dependence Regularization for Text-to-Image Diffusion Personalization	Mar 3, 2025	DenoisingDiffusion Personalization	—Unverified
TactStyle: Generating Tactile Textures with Generative AI for Digital Fabrication	Mar 3, 2025	Image GenerationTexture Synthesis	—Unverified
DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models	Mar 3, 2025	Image GenerationText Generation	—Unverified
HanDrawer: Leveraging Spatial Information to Render Realistic Hands Using a Conditional Diffusion Model in Single Stage	Mar 3, 2025	DenoisingImage Generation	—Unverified
FRMD: Fast Robot Motion Diffusion with Consistency-Distilled Movement Primitives for Smooth Action Generation	Mar 3, 2025	Action GenerationDenoising	—Unverified
Enhancing Retinal Vessel Segmentation Generalization via Layout-Aware Generative Modelling	Mar 3, 2025	DiversityImage Generation	—Unverified
Towards Improved Text-Aligned Codebook Learning: Multi-Hierarchical Codebook-Text Alignment with Long Text	Mar 3, 2025	Image GenerationQuantization	—Unverified
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
Cross Modality Medical Image Synthesis for Improving Liver Segmentation	Mar 2, 2025	Image GenerationLiver Segmentation	—Unverified
Evaluating and Predicting Distorted Human Body Parts for Generated Images	Mar 2, 2025	Image Generation	CodeCode Available
Development of an Unpaired Deep Neural Network for Synthesizing X-ray Fluoroscopic Images from Digitally Reconstructed Tomography in Image Guided Radiotherapy	Mar 1, 2025	Image GenerationSSIM	—Unverified
DiffBrush:Just Painting the Art by Your Hands	Feb 28, 2025	DenoisingImage Generation	—Unverified
SafeText: Safe Text-to-image Models via Aligning the Text Encoder	Feb 28, 2025	Image Generation	—Unverified
How far can we go with ImageNet for Text-to-Image generation?	Feb 28, 2025	Image GenerationText to Image Generation	—Unverified
Gungnir: Exploiting Stylistic Features in Images for Backdoor Attacks on Diffusion Models	Feb 28, 2025	Backdoor Attackbackdoor defense	CodeCode Available
Analyzing CLIP's Performance Limitations in Multi-Object Scenarios: A Controlled High-Resolution Study	Feb 27, 2025	Image GenerationObject	—Unverified
FlexiDiT: Your Diffusion Transformer Can Easily Generate High-Quality Samples with Less Compute	Feb 27, 2025	DenoisingImage Generation	—Unverified
Finding Local Diffusion Schrödinger Bridge using Kolmogorov-Arnold Network	Feb 27, 2025	DenoisingImage Generation	CodeCode Available
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model	Feb 27, 2025	Data AugmentationHyperspectral Image Classification	—Unverified
Multi-modal Contrastive Learning for Tumor-specific Missing Modality Synthesis	Feb 26, 2025	AnatomyContrastive Learning	—Unverified
Optimal Stochastic Trace Estimation in Generative Modeling	Feb 26, 2025	Image GenerationTime Series	—Unverified

Show:10 25 50

← PrevPage 53 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified