Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2501–2550 of 6689 papers

Title	Date	Tasks	Status
BizGen: Advancing Article-level Visual Text Rendering for Infographics Generation	Mar 26, 2025	DescriptiveImage Generation	—Unverified
Beyond Words: Advancing Long-Text Image Generation via Multimodal Autoregressive Models	Mar 26, 2025	Image Generation	—Unverified
High Quality Diffusion Distillation on a Single GPU with Relative and Absolute Position Matching	Mar 26, 2025	GPUImage Generation	—Unverified
MMGen: Unified Multi-modal Image Generation and Understanding in One Go	Mar 26, 2025	Image Generation	—Unverified
SITA: Structurally Imperceptible and Transferable Adversarial Attacks for Stylized Image Generation	Mar 25, 2025	Computational EfficiencyImage Generation	CodeCode Available
Reverse Prompt: Cracking the Recipe Inside Text-to-Image Generation	Mar 25, 2025	Image CaptioningImage Generation	—Unverified
PCM : Picard Consistency Model for Fast Parallel Sampling of Diffusion Models	Mar 25, 2025	DenoisingImage Generation	—Unverified
Exploring Disentangled and Controllable Human Image Synthesis: From End-to-End to Stage-by-Stage	Mar 25, 2025	DisentanglementImage Generation	—Unverified
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration	Mar 25, 2025	Image GenerationObject	CodeCode Available
VectorFit : Adaptive Singular & Bias Vector Fine-Tuning of Pre-trained Foundation Models	Mar 25, 2025	image-classificationImage Classification	—Unverified
Plug-and-Play Interpretable Responsible Text-to-Image Generation via Dual-Space Multi-facet Concept Control	Mar 24, 2025	Image GenerationKnowledge Distillation	—Unverified
Training-free Diffusion Acceleration with Bottleneck Sampling	Mar 24, 2025	DenoisingImage Generation	—Unverified
PALATE: Peculiar Application of the Law of Total Expectation to Enhance the Evaluation of Deep Generative Models	Mar 24, 2025	Computational EfficiencyImage Generation	CodeCode Available
Boosting Resolution Generalization of Diffusion Transformers with Randomized Positional Encodings	Mar 24, 2025	Data AugmentationImage Cropping	—Unverified
Adoption of Watermarking Measures for AI-Generated Content and Implications under the EU AI Act	Mar 23, 2025	Image Generation	—Unverified
An Image-like Diffusion Method for Human-Object Interaction Detection	Mar 23, 2025	Human-Object Interaction DetectionImage Generation	—Unverified
TCFG: Tangential Damping Classifier-free Guidance	Mar 23, 2025	Image Generation	—Unverified
TransAnimate: Taming Layer Diffusion to Generate RGBA Video	Mar 23, 2025	Image GenerationVideo Generation	—Unverified
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation	Mar 22, 2025	Image GenerationReinforcement Learning (RL)	—Unverified
Efficient Diffusion Training through Parallelization with Truncated Karhunen-Loève Expansion	Mar 22, 2025	DenoisingImage Generation	—Unverified
OMR-Diffusion:Optimizing Multi-Round Enhanced Training in Diffusion Models for Improved Intent Understanding	Mar 22, 2025	Image Generation	—Unverified
DynASyn: Multi-Subject Personalization Enabling Dynamic Action Synthesis	Mar 22, 2025	Image AugmentationImage Generation	—Unverified
FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation	Mar 22, 2025	DiagnosticImage Generation	—Unverified
TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation	Mar 22, 2025	Image GenerationText to Image Generation	—Unverified
D2C: Unlocking the Potential of Continuous Autoregressive Image Generation with Discrete Tokens	Mar 21, 2025	Conditional Image GenerationImage Generation	—Unverified
Bayesian generative models can flag performance loss, bias, and out-of-distribution image content	Mar 21, 2025	Anomaly DetectionData Visualization	—Unverified
Leveraging Text-to-Image Generation for Handling Spurious Correlation	Mar 21, 2025	image-classificationImage Classification	—Unverified
Zero-Shot Styled Text Image Generation, but Make It Autoregressive	Mar 21, 2025	Image GenerationText Generation	—Unverified
End-to-end Sketch-Guided Path Planning through Imitation Learning for Autonomous Mobile Robots	Mar 21, 2025	Image GenerationImitation Learning	CodeCode Available
EDiT: Efficient Diffusion Transformers with Linear Compressed Attention	Mar 20, 2025	Image Generation	—Unverified
RL4Med-DDPO: Reinforcement Learning for Controlled Guidance Towards Diverse Medical Image Generation using Vision-Language Foundation Models	Mar 20, 2025	Image GenerationMedical Image Generation	—Unverified
Improving Autoregressive Image Generation through Coarse-to-Fine Token Prediction	Mar 20, 2025	Image GenerationLanguage Modeling	—Unverified
VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness	Mar 20, 2025	Image GenerationText to Image Generation	CodeCode Available
FreeFlux: Understanding and Exploiting Layer-Specific Roles in RoPE-Based MMDiT for Versatile Image Editing	Mar 20, 2025	Image GenerationPosition	—Unverified
World Knowledge from AI Image Generation for Robot Control	Mar 20, 2025	Image GenerationWorld Knowledge	—Unverified
PromptMobile: Efficient Promptus for Low Bandwidth Mobile Video Streaming	Mar 20, 2025	Image GenerationVideo Compression	—Unverified
ATTENTION2D: Communication Efficient Distributed Self-Attention Mechanism	Mar 20, 2025	Image GenerationText Generation	—Unverified
LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images	Mar 20, 2025	Caption GenerationDiversity	—Unverified
A Survey on fMRI-based Brain Decoding for Reconstructing Multimodal Stimuli	Mar 20, 2025	Brain DecodingImage Generation	CodeCode Available
Di[M]O: Distilling Masked Diffusion Models into One-step Generator	Mar 19, 2025	Conditional Image GenerationImage Generation	—Unverified
CAM-Seg: A Continuous-valued Embedding Approach for Semantic Image Generation	Mar 19, 2025	Domain AdaptationImage Generation	CodeCode Available
Advancing Deep Learning through Probability Engineering: A Pragmatic Paradigm for Modern AI	Mar 19, 2025	Deep LearningFederated Learning	—Unverified
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers	Mar 19, 2025	Image GenerationQuantization	CodeCode Available
FetalFlex: Anatomy-Guided Diffusion Model for Flexible Control on Fetal Ultrasound Image Synthesis	Mar 19, 2025	AnatomyAnomaly Detection	—Unverified
Guardians of Generation: Dynamic Inference-Time Copyright Shielding with Adaptive Guidance for AI Image Generation	Mar 19, 2025	Image Generation	—Unverified
Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis	Mar 19, 2025	Few-Shot LearningImage Generation	—Unverified
TF-TI2I: Training-Free Text-and-Image-to-Image Generation via Multi-Modal Implicit-Context Learning in Text-to-Image Models	Mar 19, 2025	Image Generation	—Unverified
DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers	Mar 18, 2025	Image GenerationText to Image Generation	—Unverified
ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing	Mar 18, 2025	Image Generation	—Unverified
DefectFill: Realistic Defect Generation with Inpainting Diffusion Model for Visual Inspection	Mar 18, 2025	Image Generation	—Unverified

Show:10 25 50

← PrevPage 51 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified