Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3201–3250 of 6689 papers

Title	Date	Tasks	Status
Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images	Oct 30, 2024	Image GenerationSuper-Resolution	CodeCode Available
RelationBooth: Towards Relation-Aware Customized Object Generation	Oct 30, 2024	Image GenerationObject	—Unverified
st-DTPM: Spatial-Temporal Guided Diffusion Transformer Probabilistic Model for Delayed Scan PET Image Prediction	Oct 30, 2024	DenoisingImage Generation	—Unverified
Diffusion Beats Autoregressive: An Evaluation of Compositional Generation in Text-to-Image Models	Oct 30, 2024	Image Generation	—Unverified
Private Synthetic Text Generation with Diffusion Models	Oct 30, 2024	Image GenerationText Generation	CodeCode Available
Identifying Drift, Diffusion, and Causal Structure from Temporal Snapshots	Oct 30, 2024	Image Generationparameter estimation	CodeCode Available
FlowDCN: Exploring DCN-like Architectures for Fast Image Generation with Arbitrary Resolution	Oct 30, 2024	Image Generation	—Unverified
Multi-student Diffusion Distillation for Better One-step Generators	Oct 30, 2024	Image Generation	—Unverified
MoLE: Enhancing Human-centric Text-to-image Diffusion via Mixture of Low-rank Experts	Oct 30, 2024	Image GenerationText to Image Generation	—Unverified
Discrete Modeling via Boundary Conditional Diffusion Processes	Oct 29, 2024	Image GenerationLanguage Modeling	—Unverified
HairDiffusion: Vivid Multi-Colored Hair Editing via Latent Diffusion	Oct 29, 2024	Image Generation	—Unverified
Adapting Diffusion Models for Improved Prompt Compliance and Controllable Image Synthesis	Oct 29, 2024	Continual LearningImage Generation	CodeCode Available
Fingerprints of Super Resolution Networks	Oct 29, 2024	Image GenerationImage Super-Resolution	—Unverified
FairSkin: Fair Diffusion for Skin Disease Image Generation	Oct 29, 2024	Data AugmentationDiagnostic	—Unverified
Murine AI excels at cats and cheese: Structural differences between human and mouse neurons and their implementation in generative AIs	Oct 28, 2024	DenoisingGenerative Adversarial Network	CodeCode Available
Meta-Learning for Speeding Up Large Model Inference in Decentralized Environments	Oct 28, 2024	Decision MakingImage Generation	—Unverified
Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences	Oct 28, 2024	DiagnosticImage Generation	—Unverified
CompGS: Unleashing 2D Compositionality for Compositional Text-to-3D via Dynamically Optimizing 3D Gaussians	Oct 28, 2024	3D GenerationImage Generation	—Unverified
Generator Matching: Generative modeling with arbitrary Markov processes	Oct 27, 2024	Image Generation	—Unverified
Classification under strategic adversary manipulation using pessimistic bilevel optimisation	Oct 26, 2024	Image GenerationMalware Detection	—Unverified
Diff-CXR: Report-to-CXR generation through a disease-knowledge enhanced diffusion model	Oct 26, 2024	Image Generation	—Unverified
Image Generation from Image Captioning -- Invertible Approach	Oct 26, 2024	Image CaptioningImage Generation	—Unverified
Copyright-Aware Incentive Scheme for Generative Art Models Using Hierarchical Reinforcement Learning	Oct 26, 2024	Hierarchical Reinforcement LearningImage Generation	—Unverified
Your Image is Secretly the Last Frame of a Pseudo Video	Oct 26, 2024	Data AugmentationImage Generation	—Unverified
High Resolution Seismic Waveform Generation using Denoising Diffusion	Oct 25, 2024	DenoisingImage Generation	—Unverified
Decoding Diffusion: A Scalable Framework for Unsupervised Analysis of Latent Space Biases and Representations Using Natural Language Prompts	Oct 25, 2024	DenoisingImage Captioning	—Unverified
Simpler Diffusion (SiD2): 1.5 FID on ImageNet512 with pixel-space diffusion	Oct 25, 2024	Image GenerationVideo Prediction	—Unverified
Towards Visual Text Design Transfer Across Languages	Oct 24, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
Multi-Scale Diffusion: Enhancing Spatial Layout in High-Resolution Panoramic Image Generation	Oct 24, 2024	Image Generation	—Unverified
Ali-AUG: Innovative Approaches to Labeled Data Augmentation using One-Step Diffusion Model	Oct 24, 2024	Data AugmentationImage Generation	—Unverified
FairQueue: Rethinking Prompt Learning for Fair Text-to-Image Generation	Oct 24, 2024	AttributeDenoising	—Unverified
Stable Consistency Tuning: Understanding and Improving Consistency Models	Oct 24, 2024	DenoisingImage Generation	CodeCode Available
Deep Generative Models for 3D Medical Image Synthesis	Oct 23, 2024	DenoisingDiversity	—Unverified
Generation of Indian Sign Language Letters, Numbers, and Words	Oct 23, 2024	Generative Adversarial NetworkImage Generation	CodeCode Available
Scalable Ranked Preference Optimization for Text-to-Image Generation	Oct 23, 2024	Image GenerationText to Image Generation	—Unverified
TAGE: Trustworthy Attribute Group Editing for Stable Few-shot Image Generation	Oct 23, 2024	AttributeImage Generation	—Unverified
Backdoor in Seconds: Unlocking Vulnerabilities in Large Pre-trained Models via Model Editing	Oct 23, 2024	Adversarial AttackBackdoor Attack	—Unverified
A Wavelet Diffusion GAN for Image Super-Resolution	Oct 23, 2024	Dimensionality ReductionImage Generation	—Unverified
FreeVS: Generative View Synthesis on Free Driving Trajectory	Oct 23, 2024	Image GenerationNovel View Synthesis	—Unverified
Medical Imaging Complexity and its Effects on GAN Performance	Oct 23, 2024	Image Generation	CodeCode Available
Longitudinal Causal Image Synthesis	Oct 23, 2024	counterfactualImage Generation	CodeCode Available
Enhancing GANs with MMD Neural Architecture Search, PMish Activation Function, and Adaptive Rank Decomposition	Oct 23, 2024	Image Generation	CodeCode Available
Dual-Model Defense: Safeguarding Diffusion Models from Membership Inference Attacks through Disjoint Data Splitting	Oct 22, 2024	Image GenerationMemorization	—Unverified
DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization	Oct 22, 2024	DenoisingImage Generation	—Unverified
IdenBAT: Disentangled Representation Learning for Identity-Preserved Brain Age Transformation	Oct 22, 2024	Image GenerationRepresentation Learning	CodeCode Available
MPDS: A Movie Posters Dataset for Image Generation with Diffusion Model	Oct 22, 2024	4k8k	—Unverified
Altogether: Image Captioning via Re-aligning Alt-text	Oct 22, 2024	Image Captioningimage-classification	—Unverified
Offline Evaluation of Set-Based Text-to-Image Generation	Oct 22, 2024	Image GenerationText to Image Generation	CodeCode Available
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
MedDiff-FM: A Diffusion-based Foundation Model for Versatile Medical Image Applications	Oct 20, 2024	Anomaly DetectionDenoising	—Unverified

Show:10 25 50

← PrevPage 65 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified