Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 6689 papers

Title	Date	Tasks	Status	Hype
Steering Rectified Flow Models in the Vector Field for Controlled Image Generation	Nov 27, 2024	DenoisingImage Generation	—Unverified	0
FaithDiff: Unleashing Diffusion Priors for Faithful Image Super-resolution	Nov 27, 2024	Image GenerationImage Super-Resolution	—Unverified	0
Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds	Nov 27, 2024	Image GenerationText to Image Generation	—Unverified	0
Type-R: Automatically Retouching Typos for Text-to-Image Generation	Nov 27, 2024	Image GenerationText to Image Generation	—Unverified	0
Diffusion Autoencoders for Few-shot Image Generation in Hyperbolic Space	Nov 27, 2024	DiversityImage Generation	—Unverified	0
Exploring Visual Vulnerabilities via Multi-Loss Adversarial Search for Jailbreaking Vision-Language Models	Nov 27, 2024	Image GenerationSafety Alignment	—Unverified	0
FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion	Nov 27, 2024	Image Generation	—Unverified	0
OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation	Nov 27, 2024	Image Generationmultimodal generation	CodeCode Available	1
PersonaCraft: Personalized Full-Body Image Synthesis for Multiple Identities from Single References Using 3D-Model-Conditioned Diffusion	Nov 27, 2024	Image GenerationPersonalized Image Generation	—Unverified	0
TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models	Nov 27, 2024	Garment ReconstructionImage Generation	CodeCode Available	2
Diffusion Self-Distillation for Zero-Shot Customized Image Generation	Nov 27, 2024	Image GenerationLanguage Modeling	—Unverified	0
Prediction with Action: Visual Policy Learning via Joint Denoising Process	Nov 27, 2024	DenoisingImage Generation	—Unverified	0
Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient	Nov 26, 2024	GPUImage Generation	CodeCode Available	2
Image Generation with Supervised Selection Based on Multimodal Features for Semantic Communications	Nov 26, 2024	Image GenerationImage Reconstruction	—Unverified	0
Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints	Nov 26, 2024	DenoisingImage Generation	CodeCode Available	2
cWDM: Conditional Wavelet Diffusion Models for Cross-Modality 3D Medical Image Synthesis	Nov 26, 2024	Brain Tumor SegmentationImage Generation	CodeCode Available	1
Interleaved Scene Graphs for Interleaved Text-and-Image Generation Assessment	Nov 26, 2024	Image GenerationStyle Transfer	—Unverified	0
Reward Incremental Learning in Text-to-Image Generation	Nov 26, 2024	DenoisingImage Generation	—Unverified	0
ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting	Nov 26, 2024	Image GenerationText to Image Generation	—Unverified	0
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available	0
From Graph Diffusion to Graph Classification	Nov 26, 2024	ClassificationGraph Classification	—Unverified	0
An Ensemble Approach for Brain Tumor Segmentation and Synthesis	Nov 26, 2024	Brain Tumor ClassificationBrain Tumor Segmentation	—Unverified	0
DreamCache: Finetuning-Free Lightweight Personalized Image Generation via Feature Caching	Nov 26, 2024	Image GenerationPersonalized Image Generation	—Unverified	0
IMPROVE: Improving Medical Plausibility without Reliance on HumanValidation -- An Enhanced Prototype-Guided Diffusion Framework	Nov 26, 2024	Image GenerationMedical Image Generation	—Unverified	0
semantic image synthesis of anime characters based on conditional generative adversarial networks	Nov 25, 2024	Edge DetectionGenerative Adversarial Network	CodeCode Available	0
CoCoNO: Attention Contrast-and-Complete for Initial Noise Optimization in Text-to-Image Synthesis	Nov 25, 2024	Image Generation	—Unverified	0
From Diffusion to Resolution: Leveraging 2D Diffusion Models for 3D Super-Resolution Task	Nov 25, 2024	Image GenerationImage Super-Resolution	—Unverified	0
ZoomLDM: Latent Diffusion Model for multi-scale image generation	Nov 25, 2024	Image GenerationMultiple Instance Learning	CodeCode Available	1
Controllable Human Image Generation with Personalized Multi-Garments	Nov 25, 2024	DenoisingImage Generation	—Unverified	0
Text-to-Image Synthesis: A Decade Survey	Nov 25, 2024	DiversityImage Generation	—Unverified	0
CapHDR2IR: Caption-Driven Transfer from Visible Light to Infrared Domain	Nov 25, 2024	Image Generation	—Unverified	0
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified	0
Noise Diffusion for Enhancing Semantic Faithfulness in Text-to-Image Synthesis	Nov 25, 2024	Image GenerationPrompt Engineering	CodeCode Available	0
Image Generation Diversity Issues and How to Tame Them	Nov 25, 2024	DiversityImage Generation	CodeCode Available	1
One Diffusion to Generate Them All	Nov 25, 2024	AllCamera Pose Estimation	CodeCode Available	4
Debiasing Classifiers by Amplifying Bias with Latent Diffusion and Large Language Models	Nov 25, 2024	AttributeComputational Efficiency	—Unverified	0
AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks	Nov 24, 2024	Few-Shot Object DetectionImage Generation	—Unverified	0
Visual Counter Turing Test (VCT^2): Discovering the Challenges for AI-Generated Image Detection and Introducing Visual AI Index (V_AI)	Nov 24, 2024	Fake Image DetectionImage Generation	—Unverified	0
PanoLlama: Generating Endless and Coherent Panoramas with Next-Token-Prediction LLMs	Nov 24, 2024	Image Generation	CodeCode Available	1
Importance-Based Token Merging for Efficient Image and Video Generation	Nov 23, 2024	Image GenerationVideo Generation	—Unverified	0
What Makes a Scene ? Scene Graph-based Evaluation and Feedback for Controllable Generation	Nov 23, 2024	Image GenerationScene Generation	CodeCode Available	2
Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator	Nov 23, 2024	Image GenerationText to Image Generation	CodeCode Available	0
MUNBa: Machine Unlearning via Nash Bargaining	Nov 23, 2024	image-classificationImage Classification	CodeCode Available	0
ConsistentAvatar: Learning to Diffuse Fully Consistent Talking Head Avatar with Temporal Guidance	Nov 23, 2024	Image Generationsingle-image-generation	—Unverified	0
Interactive Visual Assessment for Text-to-Image Generation Models	Nov 23, 2024	Image GenerationLogical Reasoning	—Unverified	0
Gradient-Free Classifier Guidance for Diffusion Model Sampling	Nov 23, 2024	Image GenerationText to Image Generation	—Unverified	0
Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark	Nov 23, 2024	Image GenerationText to Image Generation	CodeCode Available	1
AnyText2: Visual Text Generation and Editing With Customizable Attributes	Nov 22, 2024	Image GenerationText Generation	CodeCode Available	2
Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate Reward	Nov 22, 2024	Image GenerationReinforcement Learning (RL)	—Unverified	0
Foundation Cures Personalization: Recovering Facial Personalized Models' Prompt Consistency	Nov 22, 2024	DenoisingImage Generation	—Unverified	0

Show:10 25 50

← PrevPage 26 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified