Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2900 of 6689 papers

Title	Date	Tasks	Status
Adversarial Domain Prompt Tuning and Generation for Single Domain Generalization	Jan 1, 2025	Data AugmentationDomain Generalization	—Unverified
Diffusion Prism: Enhancing Diversity and Morphology Consistency in Mask-to-Image Diffusion	Jan 1, 2025	Data AugmentationDenoising	—Unverified
Spherical Manifold Guided Diffusion Model for Panoramic Image Generation	Jan 1, 2025	ERPImage Generation	CodeCode Available
CacheQuant: Comprehensively Accelerated Diffusion Models	Jan 1, 2025	Image GenerationQuantization	—Unverified
Scaling Inference Time Compute for Diffusion Models	Jan 1, 2025	DenoisingImage Generation	—Unverified
Hierarchical Vision-Language Alignment for Text-to-Image Generation via Diffusion Models	Jan 1, 2025	Image GenerationText to Image Generation	—Unverified
A4A: Adapter for Adapter Transfer via All-for-All Mapping for Cross-Architecture Models	Jan 1, 2025	AllImage Generation	—Unverified
TFCustom: Customized Image Generation with Time-Aware Frequency Feature Guidance	Jan 1, 2025	DenoisingImage Generation	—Unverified
Devil is in the Detail: Towards Injecting Fine Details of Image Prompt in Image Generation via Conflict-free Guidance and Stratified Attention	Jan 1, 2025	Image Generation	—Unverified
Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization	Jan 1, 2025	Image GenerationSpecificity	—Unverified
Z-Magic: Zero-shot Multiple Attributes Guided Image Creator	Jan 1, 2025	AttributeImage Generation	—Unverified
Black Hole-Driven Identity Absorbing in Diffusion Models	Jan 1, 2025	DisentanglementImage Generation	—Unverified
Let's Verify and Reinforce Image Generation Step by Step	Jan 1, 2025	Image Generation	—Unverified
Multi-Group Proportional Representations for Text-to-Image Models	Jan 1, 2025	Image Generation	—Unverified
Beyond Text: Implementing Multimodal Large Language Model-Powered Multi-Agent Systems Using a No-Code Platform	Jan 1, 2025	Code GenerationImage Generation	—Unverified
Decouple-Then-Merge: Finetune Diffusion Models as Multi-Task Learning	Jan 1, 2025	DenoisingImage Generation	—Unverified
GLASS: Guided Latent Slot Diffusion for Object-Centric Learning	Jan 1, 2025	Conditional Image GenerationImage Generation	—Unverified
Adaptive Non-Uniform Timestep Sampling for Accelerating Diffusion Model Training	Jan 1, 2025	Combinatorial OptimizationImage Generation	—Unverified
Beyond Generation: A Diffusion-based Low-level Feature Extractor for Detecting AI-generated Images	Jan 1, 2025	DenoisingImage Generation	—Unverified
Generative Zero-Shot Composed Image Retrieval	Jan 1, 2025	Image GenerationImage Retrieval	—Unverified
D^2iT: Dynamic Diffusion Transformer for Accurate Image Generation	Jan 1, 2025	Image Generation	CodeCode Available
Harnessing Global-Local Collaborative Adversarial Perturbation for Anti-Customization	Jan 1, 2025	AttributeImage Generation	—Unverified
Generalizable Object Keypoint Localization from Generative Priors	Jan 1, 2025	Cross-Domain Few-ShotImage Generation	—Unverified
SKE-Layout: Spatial Knowledge Enhanced Layout Generation with LLMs	Jan 1, 2025	Contrastive LearningImage Generation	—Unverified
Adapting Text-to-Image Generation with Feature Difference Instruction for Generic Image Restoration	Jan 1, 2025	Image GenerationImage Restoration	—Unverified
Unseen Visual Anomaly Generation	Jan 1, 2025	Anomaly DetectionImage Generation	—Unverified
Regression Guided Strategy to Automated Facial Beauty Optimization through Image Synthesis	Jan 1, 2025	Image Generationregression	—Unverified
Learning Partonomic 3D Reconstruction from Image Collections	Jan 1, 2025	3D ReconstructionImage Generation	CodeCode Available
FluxSpace: Disentangled Semantic Editing in Rectified Flow Models	Jan 1, 2025	AttributeDisentanglement	—Unverified
Simpler Diffusion: 1.5 FID on ImageNet512 with Pixel-space Diffusion	Jan 1, 2025	Image Generation	—Unverified
One-Way Ticket: Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models	Jan 1, 2025	Computational EfficiencyDiversity	—Unverified
Flowing from Words to Pixels: A Noise-Free Framework for Cross-Modality Evolution	Jan 1, 2025	Depth EstimationImage Captioning	—Unverified
Finding Local Diffusion Schrodinger Bridge using Kolmogorov-Arnold Network	Jan 1, 2025	DenoisingImage Generation	CodeCode Available
Patch Matters: Training-free Fine-grained Image Caption Enhancement via Local Perception	Jan 1, 2025	Image CaptioningImage Generation	—Unverified
Yo'Chameleon: Personalized Vision and Language Generation	Jan 1, 2025	Image GenerationText Generation	—Unverified
Towards Universal Dataset Distillation via Task-Driven Diffusion	Jan 1, 2025	Dataset Distillationimage-classification	—Unverified
Consistency Posterior Sampling for Diverse Image Synthesis	Jan 1, 2025	Image GenerationImage Restoration	—Unverified
SmartSpatial: Enhancing the 3D Spatial Arrangement Capabilities of Stable Diffusion Models and Introducing a Novel 3D Spatial Evaluation Framework	Jan 1, 2025	Dependency ParsingImage Generation	—Unverified
Enhancing Early Diabetic Retinopathy Detection through Synthetic DR1 Image Generation: A StyleGAN3 Approach	Jan 1, 2025	Diabetic Retinopathy DetectionImage Generation	—Unverified
Composing Parts for Expressive Object Generation	Jan 1, 2025	AttributeDenoising	—Unverified
MC^2: Multi-concept Guidance for Customized Multi-concept Generation	Jan 1, 2025	Image GenerationText to Image Generation	CodeCode Available
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation	Jan 1, 2025	Image GenerationText-to-Video Generation	—Unverified
Token Pruning for Caching Better: 9 Times Acceleration on Stable Diffusion for Free	Dec 31, 2024	DenoisingImage Generation	CodeCode Available
MLLM-as-a-Judge for Image Safety without Human Labeling	Dec 31, 2024	Image Generation	—Unverified
Text-to-Image GAN with Pretrained Representations	Dec 30, 2024	Domain GeneralizationImage Generation	—Unverified
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis	Dec 30, 2024	counterfactualImage Generation	—Unverified
PQD: Post-training Quantization for Efficient Diffusion Models	Dec 30, 2024	DiversityImage Generation	—Unverified
Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation	Dec 30, 2024	3D GenerationImage Generation	—Unverified
Quantum Diffusion Model for Quark and Gluon Jet Generation	Dec 30, 2024	DenoisingImage Generation	CodeCode Available
Diff4MMLiTS: Advanced Multimodal Liver Tumor Segmentation via Diffusion-Based Image Synthesis and Alignment	Dec 29, 2024	Image GenerationSegmentation	—Unverified

Show:10 25 50

← PrevPage 58 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified