Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3851–3900 of 6689 papers

Title	Date	Tasks	Status
Generating Counterfactual Trajectories with Latent Diffusion Models for Concept Discovery	Apr 16, 2024	counterfactualImage Generation	—Unverified
Multi-objective evolutionary GAN for tabular data synthesis	Apr 15, 2024	Image Generation	CodeCode Available
Zero-shot detection of buildings in mobile LiDAR using Language Vision Model	Apr 15, 2024	Image Generation	—Unverified
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model	Apr 15, 2024	GPUImage Generation	—Unverified
ANCHOR: LLM-driven News Subject Conditioning for Text-to-Image Synthesis	Apr 15, 2024	DescriptiveImage Captioning	CodeCode Available
Watermark-embedded Adversarial Examples for Copyright Protection against Diffusion Models	Apr 15, 2024	Conditional Image GenerationImage Generation	—Unverified
Modeling Emotions and Ethics with Large Language Models	Apr 15, 2024	Decision MakingEthics	CodeCode Available
EdgeRelight360: Text-Conditioned 360-Degree HDR Image Generation for Real-Time On-Device Video Portrait Relighting	Apr 15, 2024	Image Generation	—Unverified
MaxFusion: Plug&Play Multi-Modal Generation in Text-to-Image Diffusion Models	Apr 15, 2024	Image GenerationText to Image Generation	—Unverified
In-Context Translation: Towards Unifying Image Recognition, Processing, and Generation	Apr 15, 2024	Conditional Image GenerationDenoising	—Unverified
Diffscaler: Enhancing the Generative Prowess of Diffusion Transformers	Apr 15, 2024	Image GenerationUnconditional Image Generation	—Unverified
DreamScape: 3D Scene Creation via Gaussian Splatting joint Correlation Modeling	Apr 14, 2024	global-optimizationImage Generation	—Unverified
Diffusion Models Meet Remote Sensing: Principles, Methods, and Perspectives	Apr 13, 2024	Image Generation	—Unverified
Semantic Approach to Quantifying the Consistency of Diffusion Model Image Generation	Apr 12, 2024	Decision MakingImage Generation	CodeCode Available
Model-based Cleaning of the QUILT-1M Pathology Dataset for Text-Conditional Image Synthesis	Apr 11, 2024	Image Generation	CodeCode Available
ObjBlur: A Curriculum Learning Approach With Progressive Object-Level Blurring for Improved Layout-to-Image Generation	Apr 11, 2024	Image GenerationLayout-to-Image Generation	—Unverified
Implicit and Explicit Language Guidance for Diffusion-based Visual Perception	Apr 11, 2024	Depth EstimationImage Generation	—Unverified
Generating Synthetic Satellite Imagery With Deep-Learning Text-to-Image Models -- Technical Challenges and Implications for Monitoring and Verification	Apr 11, 2024	Image Generation	—Unverified
Synthetic Brain Images: Bridging the Gap in Brain Mapping With Generative Adversarial Model	Apr 11, 2024	Data AugmentationDeep Learning	—Unverified
CAT: Contrastive Adapter Training for Personalized Image Generation	Apr 11, 2024	Consistent Character GenerationDiversity	CodeCode Available
A Gauss-Newton Approach for Min-Max Optimization in Generative Adversarial Networks	Apr 10, 2024	DiversityImage Generation	CodeCode Available
High Noise Scheduling is a Must	Apr 9, 2024	DenoisingImage Generation	—Unverified
Hyperparameter-Free Medical Image Synthesis for Sharing Data and Improving Site-Specific Segmentation	Apr 9, 2024	Image Generation	CodeCode Available
Automatic Controllable Colorization via Imagination	Apr 8, 2024	ColorizationImage Generation	—Unverified
Mask-ControlNet: Higher-Quality Image Generation with An Additional Mask Prompt	Apr 8, 2024	Image GenerationText to Image Generation	—Unverified
SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing	Apr 8, 2024	Image GenerationObject	—Unverified
StyleForge: Enhancing Text-to-Image Synthesis for Any Artistic Styles with Dual Binding	Apr 8, 2024	Image Generation	—Unverified
Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI	Apr 8, 2024	Image Generation	—Unverified
UniFL: Improve Latent Diffusion Model via Unified Feedback Learning	Apr 8, 2024	Image GenerationText to Image Generation	—Unverified
Strictly-ID-Preserved and Controllable Accessory Advertising Image Generation	Apr 7, 2024	Image Generation	—Unverified
ShoeModel: Learning to Wear on the User-specified Shoes via Diffusion Model	Apr 7, 2024	Image GenerationMarketing	—Unverified
Contextual Chart Generation for Cyber Deception	Apr 7, 2024	Data InteractionImage Generation	—Unverified
Concept Weaver: Enabling Multi-Concept Fusion in Text-to-Image Models	Apr 5, 2024	Image GenerationText to Image Generation	—Unverified
PHISWID: Physics-Inspired Underwater Image Dataset Synthesized from RGB-D Images	Apr 5, 2024	Image EnhancementImage Generation	CodeCode Available
Pixel-wise RL on Diffusion Models: Reinforcement Learning from Rich Feedback	Apr 5, 2024	DenoisingImage Generation	—Unverified
Would Deep Generative Models Amplify Bias in Future Models?	Apr 4, 2024	Image CaptioningImage Generation	—Unverified
GaSpCT: Gaussian Splatting for Novel CT Projection View Synthesis	Apr 4, 2024	Image GenerationImage Reconstruction	—Unverified
Reference-Based 3D-Aware Image Editing with Triplanes	Apr 4, 2024	3D geometryDisentanglement	—Unverified
Multi Positive Contrastive Learning with Pose-Consistent Generated Images	Apr 4, 2024	Contrastive LearningImage Generation	—Unverified
Diverse and Tailored Image Generation for Zero-shot Multi-label Classification	Apr 4, 2024	Image GenerationLanguage Modelling	—Unverified
MULAN: A Multi Layer Annotated Dataset for Controllable Text-to-Image Generation	Apr 3, 2024	Image GenerationPrompt Engineering	—Unverified
MatAtlas: Text-driven Consistent Geometry Texturing and Material Assignment	Apr 3, 2024	Image GenerationRetrieval	—Unverified
On the Scalability of Diffusion-based Text-to-Image Generation	Apr 3, 2024	DenoisingDiversity	—Unverified
Many-to-many Image Generation with Auto-regressive Diffusion Models	Apr 3, 2024	Image GenerationNovel View Synthesis	—Unverified
Heat Death of Generative Models in Closed-Loop Learning	Apr 2, 2024	Image Generation	—Unverified
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models	Apr 2, 2024	Adversarial AttackImage Generation	—Unverified
Real, fake and synthetic faces - does the coin have three sides?	Apr 2, 2024	Face SwappingImage Generation	—Unverified
Condition-Aware Neural Network for Controlled Image Generation	Apr 1, 2024	Conditional Image GenerationImage Generation	—Unverified
Survey of Bias In Text-to-Image Generation: Definition, Evaluation, and Mitigation	Apr 1, 2024	Image GenerationText to Image Generation	—Unverified
Action Detection via an Image Diffusion Process	Apr 1, 2024	Action DetectionImage Generation	—Unverified

Show:10 25 50

← PrevPage 78 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified