Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3150 of 6689 papers

Title	Date	Tasks	Status
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available
Interleaved Scene Graphs for Interleaved Text-and-Image Generation Assessment	Nov 26, 2024	Image GenerationStyle Transfer	—Unverified
CoCoNO: Attention Contrast-and-Complete for Initial Noise Optimization in Text-to-Image Synthesis	Nov 25, 2024	Image Generation	—Unverified
CapHDR2IR: Caption-Driven Transfer from Visible Light to Infrared Domain	Nov 25, 2024	Image Generation	—Unverified
Noise Diffusion for Enhancing Semantic Faithfulness in Text-to-Image Synthesis	Nov 25, 2024	Image GenerationPrompt Engineering	CodeCode Available
Text-to-Image Synthesis: A Decade Survey	Nov 25, 2024	DiversityImage Generation	—Unverified
Debiasing Classifiers by Amplifying Bias with Latent Diffusion and Large Language Models	Nov 25, 2024	AttributeComputational Efficiency	—Unverified
From Diffusion to Resolution: Leveraging 2D Diffusion Models for 3D Super-Resolution Task	Nov 25, 2024	Image GenerationImage Super-Resolution	—Unverified
semantic image synthesis of anime characters based on conditional generative adversarial networks	Nov 25, 2024	Edge DetectionGenerative Adversarial Network	CodeCode Available
Controllable Human Image Generation with Personalized Multi-Garments	Nov 25, 2024	DenoisingImage Generation	—Unverified
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified
AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks	Nov 24, 2024	Few-Shot Object DetectionImage Generation	—Unverified
Visual Counter Turing Test (VCT^2): Discovering the Challenges for AI-Generated Image Detection and Introducing Visual AI Index (V_AI)	Nov 24, 2024	Fake Image DetectionImage Generation	—Unverified
Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator	Nov 23, 2024	Image GenerationText to Image Generation	CodeCode Available
Interactive Visual Assessment for Text-to-Image Generation Models	Nov 23, 2024	Image GenerationLogical Reasoning	—Unverified
Importance-Based Token Merging for Efficient Image and Video Generation	Nov 23, 2024	Image GenerationVideo Generation	—Unverified
Gradient-Free Classifier Guidance for Diffusion Model Sampling	Nov 23, 2024	Image GenerationText to Image Generation	—Unverified
ConsistentAvatar: Learning to Diffuse Fully Consistent Talking Head Avatar with Temporal Guidance	Nov 23, 2024	Image Generationsingle-image-generation	—Unverified
MUNBa: Machine Unlearning via Nash Bargaining	Nov 23, 2024	image-classificationImage Classification	CodeCode Available
Efficient Pruning of Text-to-Image Models: Insights from Pruning Stable Diffusion	Nov 22, 2024	Image GenerationModel Compression	—Unverified
Prioritize Denoising Steps on Diffusion Model Preference Alignment via Explicit Denoised Distribution Estimation	Nov 22, 2024	DenoisingImage Generation	—Unverified
Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate Reward	Nov 22, 2024	Image GenerationReinforcement Learning (RL)	—Unverified
High-Resolution Image Synthesis via Next-Token Prediction	Nov 22, 2024	Conditional Image GenerationDenoising	—Unverified
HeadRouter: A Training-free Image Editing Framework for MM-DiTs by Adaptively Routing Attention Heads	Nov 22, 2024	Image Generationtext-guided-image-editing	—Unverified
Latent Schrodinger Bridge: Prompting Latent Diffusion for Fast Unpaired Image-to-Image Translation	Nov 22, 2024	Image GenerationImage-to-Image Translation	—Unverified
Reconciling Semantic Controllability and Diversity for Remote Sensing Image Synthesis with Hybrid Semantic Embedding	Nov 22, 2024	Data AugmentationDiversity	—Unverified
Learning Modality-Aware Representations: Adaptive Group-wise Interaction Network for Multimodal MRI Synthesis	Nov 22, 2024	Image GenerationImage-to-Image Translation	CodeCode Available
Foundation Cures Personalization: Recovering Facial Personalized Models' Prompt Consistency	Nov 22, 2024	DenoisingImage Generation	—Unverified
Exploiting Watermark-Based Defense Mechanisms in Text-to-Image Diffusion Models for Unauthorized Data Usage	Nov 22, 2024	Image Generation	—Unverified
Unsupervised Multi-view UAV Image Geo-localization via Iterative Rendering	Nov 22, 2024	geo-localizationImage Generation	—Unverified
ComfyGI: Automatic Improvement of Image Generation Workflows	Nov 21, 2024	Image Generation	—Unverified
Edge-Cloud Routing for Text-to-Image Model with Token-Level Multi-Metric Prediction	Nov 21, 2024	Image Generation	—Unverified
Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction	Nov 21, 2024	Image GenerationModel Editing	—Unverified
Dealing with Synthetic Data Contamination in Online Continual Learning	Nov 21, 2024	Continual LearningImage Generation	CodeCode Available
GalaxyEdit: Large-Scale Image Editing Dataset with Enhanced Diffusion Adapter	Nov 21, 2024	Image Generation	—Unverified
Text Embedding is Not All You Need: Attention Control for Text-to-Image Semantic Alignment with Text Self-Attention Maps	Nov 21, 2024	AllAttribute	—Unverified
CopyrightMeter: Revisiting Copyright Protection in Text-to-image Models	Nov 20, 2024	Image GenerationText to Image Generation	—Unverified
CCIS-Diff: A Generative Model with Stable Diffusion Prior for Controlled Colonoscopy Image Synthesis	Nov 19, 2024	DiagnosticImage Generation	—Unverified
Adaptively Controllable Diffusion Model for Efficient Conditional Image Generation	Nov 19, 2024	Conditional Image GenerationImage Generation	—Unverified
Frequency-Aware Guidance for Blind Image Restoration via Diffusion Models	Nov 19, 2024	Blind Image DeblurringDeblurring	—Unverified
Constant Rate Schedule: Constant-Rate Distributional Change for Efficient Training and Sampling in Diffusion Models	Nov 19, 2024	Conditional Image GenerationImage Generation	—Unverified
Enhancing Low Dose Computed Tomography Images Using Consistency Training Techniques	Nov 19, 2024	Image GenerationImage Inpainting	—Unverified
Zoomed In, Diffused Out: Towards Local Degradation-Aware Multi-Diffusion for Extreme Image Super-Resolution	Nov 18, 2024	2k4k	CodeCode Available
Cascaded Diffusion Models for 2D and 3D Microscopy Image Synthesis to Enhance Cell Segmentation	Nov 18, 2024	Cell SegmentationImage Generation	CodeCode Available
Decoupling Training-Free Guided Diffusion by ADMM	Nov 18, 2024	Image GenerationMotion Synthesis	—Unverified
BeautyBank: Encoding Facial Makeup in Latent Space	Nov 18, 2024	Image Generation	—Unverified
A Modular Open Source Framework for Genomic Variant Calling	Nov 18, 2024	Drug DiscoveryImage Generation	—Unverified
Conceptwm: A Diffusion Model Watermark for Concept Protection	Nov 18, 2024	Image Generation	—Unverified
Time Step Generating: A Universal Synthesized Deepfake Image Detector	Nov 17, 2024	DenoisingFace Swapping	CodeCode Available
Enhanced Anime Image Generation Using USE-CMHSA-GAN	Nov 17, 2024	Generative Adversarial NetworkImage Generation	—Unverified

Show:10 25 50

← PrevPage 63 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified