Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2600 of 6689 papers

Title	Date	Tasks	Status
Deeply Supervised Flow-Based Generative Models	Mar 18, 2025	Image GenerationText to Image Generation	—Unverified
Free-Lunch Color-Texture Disentanglement for Stylized Image Generation	Mar 18, 2025	DisentanglementImage Generation	—Unverified
ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing	Mar 18, 2025	Image Generation	—Unverified
DreamRenderer: Taming Multi-Instance Attribute Control in Large-Scale Text-to-Image Models	Mar 17, 2025	AttributeImage Generation	—Unverified
BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing	Mar 17, 2025	Computational EfficiencyData Augmentation	—Unverified
Unified Autoregressive Visual Generation and Understanding with Continuous Tokens	Mar 17, 2025	Image CaptioningImage Generation	—Unverified
EditID: Training-Free Editable ID Customization for Text-to-Image Generation	Mar 16, 2025	Image GenerationSemantic Compression	—Unverified
Personalize Anything for Free with Diffusion Transformer	Mar 16, 2025	Computational EfficiencyDenoising	—Unverified
DiffAD: A Unified Diffusion Modeling Approach for Autonomous Driving	Mar 15, 2025	Autonomous DrivingBench2Drive	—Unverified
LAPIG: Language Guided Projector Image Generation with Surface Adaptation and Stylization	Mar 15, 2025	Image Generation	—Unverified
Direction-Aware Diagonal Autoregressive Image Generation	Mar 14, 2025	Image Generation	—Unverified
Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization	Mar 14, 2025	Image CompressionImage Generation	—Unverified
Safe-VAR: Safe Visual Autoregressive Model for Text-to-Image Generative Watermarking	Mar 14, 2025	Image GenerationText to Image Generation	—Unverified
PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models	Mar 13, 2025	Image GenerationImage Manipulation	—Unverified
Do I look like a `cat.n.01` to you? A Taxonomy Image Generation Benchmark	Mar 13, 2025	Common Sense ReasoningImage Generation	—Unverified
DiT-Air: Revisiting the Efficiency of Diffusion Model Architecture Design in Text to Image Generation	Mar 13, 2025	Image GenerationText to Image Generation	—Unverified
RealGeneral: Unifying Visual Generation via Temporal In-Context Learning with Video Models	Mar 13, 2025	Image GenerationIn-Context Learning	—Unverified
MACS: Multi-source Audio-to-image Generation with Contextual Significance and Semantic Alignment	Mar 13, 2025	Image Generation	CodeCode Available
Proxy-Tuning: Tailoring Multimodal Autoregressive Models for Subject-Driven Image Generation	Mar 13, 2025	Image Generation	—Unverified
Visual Polarization Measurement Using Counterfactual Image Generation	Mar 13, 2025	counterfactualDescriptive	—Unverified
Memory-Efficient 3D High-Resolution Medical Image Synthesis Using CRF-Guided GANs	Mar 13, 2025	Image Generation	—Unverified
ExtremeAIGC: Benchmarking LMM Vulnerability to AI-Generated Extremist Content	Mar 13, 2025	BenchmarkingImage Generation	—Unverified
MoEdit: On Learning Quantity Perception for Multi-object Image Editing	Mar 13, 2025	AttributeImage Generation	CodeCode Available
ConceptGuard: Continual Personalized Text-to-Image Generation with Forgetting and Confusion Mitigation	Mar 13, 2025	Image GenerationText to Image Generation	—Unverified
UniCombine: Unified Multi-Conditional Combination with Diffusion Transformer	Mar 12, 2025	Image Generation	—Unverified
Zero-Shot Subject-Centric Generation for Creative Application Using Entropy Fusion	Mar 12, 2025	DescriptiveImage Generation	—Unverified
PromptMap: An Alternative Interaction Style for AI-Based Image Generation	Mar 12, 2025	Image GenerationSemantic Similarity	CodeCode Available
Decoupled Doubly Contrastive Learning for Cross Domain Facial Action Unit Detection	Mar 12, 2025	Action Unit DetectionContrastive Learning	—Unverified
DAMM-Diffusion: Learning Divergence-Aware Multi-Modal Diffusion Model for Nanoparticles Distribution Prediction	Mar 12, 2025	Image Generation	CodeCode Available
Active Learning Inspired ControlNet Guidance for Augmenting Semantic Segmentation Datasets	Mar 12, 2025	Active LearningConditional Image Generation	—Unverified
Revealing Unintentional Information Leakage in Low-Dimensional Facial Portrait Representations	Mar 12, 2025	Image Generation	CodeCode Available
FCaS: Fine-grained Cardiac Image Synthesis based on 3D Template Conditional Diffusion Model	Mar 12, 2025	Image Generation	—Unverified
Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models	Mar 12, 2025	AttributeDiversity	—Unverified
Exploring Position Encoding in Diffusion U-Net for Training-free High-resolution Image Generation	Mar 12, 2025	AttributeDenoising	—Unverified
NAMI: Efficient Image Generation via Progressive Rectified Flow Transformers	Mar 12, 2025	Image Generation	—Unverified
A Deep Bayesian Nonparametric Framework for Robust Mutual Information Estimation	Mar 11, 2025	Image GenerationMutual Information Estimation	—Unverified
Generating Robot Constitutions & Benchmarks for Semantic Safety	Mar 11, 2025	Collision AvoidanceImage Generation	—Unverified
GarmentCrafter: Progressive Novel View Synthesis for Single-View 3D Garment Reconstruction and Editing	Mar 11, 2025	3D ReconstructionDepth Estimation	—Unverified
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens	Mar 11, 2025	DecoderImage Generation	CodeCode Available
NeAS: 3D Reconstruction from X-ray Images using Neural Attenuation Surface	Mar 10, 2025	3D ReconstructionImage Generation	—Unverified
EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer	Mar 10, 2025	Computational EfficiencyImage Generation	—Unverified
NFIG: Autoregressive Image Generation with Next-Frequency Prediction	Mar 10, 2025	Image GenerationPrediction	—Unverified
Can Generative Geospatial Diffusion Models Excel as Discriminative Geospatial Foundation Models?	Mar 10, 2025	Contrastive LearningImage Generation	—Unverified
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping	Mar 10, 2025	DenoisingImage Generation	—Unverified
Synthetic Lung X-ray Generation through Cross-Attention and Affinity Transformation	Mar 10, 2025	Image GenerationMedical Image Analysis	—Unverified
TIDE : Temporal-Aware Sparse Autoencoders for Interpretable Diffusion Transformers in Image Generation	Mar 10, 2025	DenoisingImage Generation	—Unverified
LatexBlend: Scaling Multi-concept Customized Generation with Latent Textual Blending	Mar 10, 2025	Computational EfficiencyDenoising	—Unverified
Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia	Mar 10, 2025	DiversityImage Generation	CodeCode Available
Text-to-Image Diffusion Models Cannot Count, and Prompt Refinement Cannot Help	Mar 10, 2025	Image GenerationText to Image Generation	—Unverified
NukesFormers: Unpaired Hyperspectral Image Generation with Non-Uniform Domain Alignment	Mar 10, 2025	Contrastive LearningImage Generation	—Unverified

Show:10 25 50

← PrevPage 52 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified