Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 6689 papers

Title	Date	Tasks	Status
Zero-shot Text-guided Infinite Image Synthesis with LLM guidance	Jul 17, 2024	Image Generationtext-guided-image-editing	—Unverified
I2AM: Interpreting Image-to-Image Latent Diffusion Models via Attribution Maps	Jul 17, 2024	Image AttributionImage Generation	—Unverified
Towards Understanding Unsafe Video Generation	Jul 17, 2024	Image GenerationVideo Generation	CodeCode Available
Promptable Counterfactual Diffusion Model for Unified Brain Tumor Segmentation and Generation with MRIs	Jul 17, 2024	Brain Tumor SegmentationBraTS2021	CodeCode Available
Flatfish Disease Detection Based on Part Segmentation Approach and Disease Image Generation	Jul 16, 2024	Image GenerationImage Harmonization	—Unverified
How Control Information Influences Multilingual Text Image Generation and Editing?	Jul 16, 2024	DecoderDenoising	CodeCode Available
Subject-driven Text-to-Image Generation via Preference-based Reinforcement Learning	Jul 16, 2024	Image GenerationModel Selection	CodeCode Available
Beta Sampling is All You Need: Efficient Image Generation Strategy for Diffusion Models using Stepwise Spectral Analysis	Jul 16, 2024	AllDenoising	—Unverified
DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training	Jul 16, 2024	AnatomyData Augmentation	—Unverified
Zero-Shot Adaptation for Approximate Posterior Sampling of Diffusion Models in Inverse Problems	Jul 16, 2024	Computational EfficiencyDeblurring	CodeCode Available
Efficient Training with Denoised Neural Weights	Jul 16, 2024	Image GenerationImage-to-Image Translation	—Unverified
Mask-guided cross-image attention for zero-shot in-silico histopathologic image generation with a diffusion model	Jul 16, 2024	Appearance TransferImage Generation	—Unverified
Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis	Jul 15, 2024	6D Pose EstimationDiversity	—Unverified
OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting	Jul 15, 2024	Image GenerationMamba	—Unverified
Addressing Image Hallucination in Text-to-Image Generation through Factual Image Retrieval	Jul 15, 2024	Common Sense ReasoningHallucination	—Unverified
Optical Diffusion Models for Image Generation	Jul 15, 2024	DenoisingImage Generation	—Unverified
Physics-Inspired Generative Models in Medical Imaging: A Review	Jul 15, 2024	DenoisingImage Generation	—Unverified
A Survey of Defenses against AI-generated Visual Media: Detection, Disruption, and Authentication	Jul 15, 2024	FairnessImage Generation	—Unverified
ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context	Jul 13, 2024	Image GenerationStory Continuation	CodeCode Available
Layout-and-Retouch: A Dual-stage Framework for Improving Diversity in Personalized Image Generation	Jul 13, 2024	DiversityImage Generation	—Unverified
FairyLandAI: Personalized Fairy Tales utilizing ChatGPT and DALLE-3	Jul 12, 2024	Image GenerationLanguage Modelling	—Unverified
Machine Apophenia: The Kaleidoscopic Generation of Architectural Images	Jul 12, 2024	Image Generation	—Unverified
Surgical Text-to-Image Generation	Jul 12, 2024	Image GenerationText to Image Generation	—Unverified
E2VIDiff: Perceptual Events-to-Video Reconstruction using Diffusion Priors	Jul 11, 2024	Image GenerationVideo Generation	—Unverified
Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets	Jul 11, 2024	Image GenerationInformativeness	CodeCode Available
Boosting Medical Image Synthesis via Registration-guided Consistency and Disentanglement Learning	Jul 10, 2024	AnatomyDisentanglement	—Unverified
Sketch-Guided Scene Image Generation	Jul 9, 2024	Image GenerationObject	—Unverified
Accelerating Mobile Edge Generation (MEG) by Constrained Learning	Jul 9, 2024	DenoisingImage Generation	—Unverified
Few-Shot Image Generation by Conditional Relaxing Diffusion Inversion	Jul 9, 2024	DiversityFew-Shot Learning	—Unverified
Spanish TrOCR: Leveraging Transfer Learning for Language Adaptation	Jul 9, 2024	DecoderImage Generation	CodeCode Available
MMIS: Multimodal Dataset for Interior Scene Visual Generation and Recognition	Jul 8, 2024	Image GenerationRepresentation Learning	—Unverified
GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing	Jul 8, 2024	Image GenerationLanguage Modeling	—Unverified
JeDi: Joint-Image Diffusion Models for Finetuning-Free Personalized Text-to-Image Generation	Jul 8, 2024	Dataset GenerationImage Generation	—Unverified
MobilePortrait: Real-Time One-Shot Neural Head Avatars on Mobile Devices	Jul 8, 2024	Image GenerationPortrait Animation	—Unverified
Layered Diffusion Model for One-Shot High Resolution Text-to-Image Synthesis	Jul 8, 2024	Image GenerationSuper-Resolution	—Unverified
Rethinking Image Skip Connections in StyleGAN2	Jul 8, 2024	Image Generation	—Unverified
An Improved Method for Personalizing Diffusion Models	Jul 7, 2024	Image Generation	—Unverified
Multi-scale Conditional Generative Modeling for Microscopic Image Restoration	Jul 7, 2024	DiversityImage Generation	—Unverified
Enhancing Label-efficient Medical Image Segmentation with Text-guided Diffusion Models	Jul 7, 2024	DenoisingDiagnostic	—Unverified
PROUD: PaRetO-gUided Diffusion Model for Multi-objective Generation	Jul 5, 2024	DenoisingImage Generation	CodeCode Available
DiCTI: Diffusion-based Clothing Designer via Text-guided Input	Jul 4, 2024	Image GenerationVirtual Try-on	—Unverified
Medical Image Fusion for High-Level Analysis: A Mutual Enhancement Framework for Unaligned PAT and MRI	Jul 4, 2024	AnatomyImage Generation	CodeCode Available
Model Collapse in the Self-Consuming Chain of Diffusion Finetuning: A Novel Perspective from Quantitative Trait Modeling	Jul 4, 2024	Image GenerationScheduling	—Unverified
Lateralization LoRA: Interleaved Instruction Tuning with Modality-Specialized Adaptations	Jul 4, 2024	AttributeImage Generation	—Unverified
Representation learning with CGAN for casual inference	Jul 3, 2024	Causal InferenceConditional Image Generation	—Unverified
BACON: Improving Clarity of Image Captions via Bag-of-Concept Graphs	Jul 3, 2024	Image CaptioningImage Generation	—Unverified
Mobile Edge Generation-Enabled Digital Twin: Architecture Design and Research Opportunities	Jul 3, 2024	Image Generation	CodeCode Available
SwiftDiffusion: Efficient Diffusion Model Serving with Add-on Modules	Jul 2, 2024	Image Generation	—Unverified
UltraPixel: Advancing Ultra-High-Resolution Image Synthesis to New Peaks	Jul 2, 2024	Computational EfficiencyDenoising	—Unverified
Label-free Neural Semantic Image Synthesis	Jul 1, 2024	Image GenerationSemantic Segmentation	—Unverified

Show:10 25 50

← PrevPage 72 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified