Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3500 of 6689 papers

Title	Date	Tasks	Status
Sequential-Scanning Dual-Energy CT Imaging Using High Temporal Resolution Image Reconstruction and Error-Compensated Material Basis Image Generation	Aug 27, 2024	Image GenerationImage Reconstruction	—Unverified
Foodfusion: A Novel Approach for Food Image Composition via Diffusion Models	Aug 26, 2024	DenoisingImage Generation	—Unverified
ConceptMix: A Compositional Image Generation Benchmark with Controllable Difficulty	Aug 26, 2024	DiversityImage Generation	—Unverified
Prior Learning in Introspective VAEs	Aug 25, 2024	Density EstimationImage Generation	—Unverified
HTS-Attack: Heuristic Token Search for Jailbreaking Text-to-Image Models	Aug 25, 2024	Heuristic SearchImage Generation	—Unverified
Variational autoencoder-based neural network model compression	Aug 25, 2024	Anomaly DetectionImage Generation	—Unverified
Explainable Concept Generation through Vision-Language Preference Learning	Aug 24, 2024	DiagnosticImage Generation	—Unverified
Prompt-Softbox-Prompt: A free-text Embedding Control for Image Editing	Aug 24, 2024	Image GenerationStyle Transfer	—Unverified
Shape-Preserving Generation of Food Images for Automatic Dietary Assessment	Aug 23, 2024	Image Generation	—Unverified
Abstract Art Interpretation Using ControlNet	Aug 23, 2024	Image Generation	CodeCode Available
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation	Aug 23, 2024	Image GenerationVideo Generation	—Unverified
G3FA: Geometry-guided GAN for Face Animation	Aug 23, 2024	Face ReenactmentImage Generation	—Unverified
What Do You Want? User-centric Prompt Generation for Text-to-image Synthesis via Multi-turn Guidance	Aug 23, 2024	Image GenerationPrompt Engineering	CodeCode Available
Rethinking Training for De-biasing Text-to-Image Generation: Unlocking the Potential of Stable Diffusion	Aug 22, 2024	FairnessImage Generation	—Unverified
MedDiT: A Knowledge-Controlled Diffusion Transformer Framework for Dynamic Medical Image Generation in Virtual Simulated Patient	Aug 22, 2024	DiagnosticHallucination	—Unverified
DimeRec: A Unified Framework for Enhanced Sequential Recommendation via Generative Diffusion Models	Aug 22, 2024	Image GenerationRecommendation Systems	—Unverified
Dynamic Product Image Generation and Recommendation at Scale for Personalized E-commerce	Aug 22, 2024	Image GenerationMulti-Armed Bandits	—Unverified
CODE: Confident Ordinary Differential Editing	Aug 22, 2024	Conditional Image GenerationImage Generation	CodeCode Available
Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models	Aug 21, 2024	DenoisingImage Generation	—Unverified
Pixel Is Not A Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models	Aug 21, 2024	DenoisingImage Generation	—Unverified
Latent Feature and Attention Dual Erasure Attack against Multi-View Diffusion Models for 3D Assets Protection	Aug 21, 2024	3D geometryImage Generation	CodeCode Available
FRAP: Faithful and Realistic Text-to-Image Generation with Adaptive Prompt Weighting	Aug 21, 2024	Image GenerationText to Image Generation	—Unverified
MS^3D: A RG Flow-Based Regularization for GAN Training with Limited Data	Aug 20, 2024	Image Generation	—Unverified
A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse	Aug 20, 2024	Image Generation	—Unverified
SANER: Annotation-free Societal Attribute Neutralizer for Debiasing CLIP	Aug 19, 2024	AttributeImage Generation	—Unverified
The Brittleness of AI-Generated Image Watermarking Techniques: Examining Their Robustness Against Visual Paraphrasing Attacks	Aug 19, 2024	DenoisingImage Captioning	—Unverified
Reconstruct Spine CT from Biplanar X-Rays via Diffusion Learning	Aug 19, 2024	CT ReconstructionImage Generation	—Unverified
Deformation-aware GAN for Medical Image Synthesis with Substantially Misaligned Pairs	Aug 18, 2024	Image Generation	—Unverified
SketchRef: A Benchmark Dataset and Evaluation Metrics for Automated Sketch Synthesis	Aug 16, 2024	8kImage Generation	—Unverified
An End-to-End Model for Photo-Sharing Multi-modal Dialogue Generation	Aug 16, 2024	Dialogue GenerationImage Generation	CodeCode Available
Comparative Analysis of Generative Models: Enhancing Image Synthesis with VAEs, GANs, and Stable Diffusion	Aug 16, 2024	Image Generation	—Unverified
Accelerated Image-Aware Generative Diffusion Modeling	Aug 15, 2024	DiversityImage Generation	—Unverified
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations	Aug 15, 2024	Image GenerationQuantization	—Unverified
Boosting Unconstrained Face Recognition with Targeted Style Adversary	Aug 14, 2024	Face RecognitionImage Generation	—Unverified
MagicFace: Training-free Universal-Style Human Image Customized Synthesis	Aug 14, 2024	AttributeImage Generation	—Unverified
A Comprehensive Survey on Synthetic Infrared Image synthesis	Aug 13, 2024	Image GenerationSurvey	—Unverified
DiffLoRA: Generating Personalized Low-Rank Adaptation Weights with Diffusion	Aug 13, 2024	Image GenerationText to Image Generation	—Unverified
Hybrid SD: Edge-Cloud Collaborative Inference for Stable Diffusion Models	Aug 13, 2024	Collaborative InferenceDiversity	—Unverified
SeLoRA: Self-Expanding Low-Rank Adaptation of Latent Diffusion Model for Medical Image Synthesis	Aug 13, 2024	Image Generation	—Unverified
Prompt Recovery for Image Generation Models: A Comparative Study of Discrete Optimizers	Aug 12, 2024	Image Generation	—Unverified
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance	Aug 12, 2024	Image GenerationNovel View Synthesis	—Unverified
Artworks Reimagined: Exploring Human-AI Co-Creation through Body Prompting	Aug 10, 2024	Image GenerationText to Image Generation	—Unverified
Instruction Tuning-free Visual Token Complement for Multimodal LLMs	Aug 9, 2024	Image GenerationImage to text	—Unverified
DAFT-GAN: Dual Affine Transformation Generative Adversarial Network for Text-Guided Image Inpainting	Aug 9, 2024	Generative Adversarial NetworkImage Generation	—Unverified
Zero-Shot Uncertainty Quantification using Diffusion Probabilistic Models	Aug 8, 2024	Image GenerationPrediction	—Unverified
A comparative study of generative adversarial networks for image recognition algorithms based on deep learning and traditional methods	Aug 7, 2024	Generative Adversarial NetworkImage Generation	—Unverified
Data Generation Scheme for Thermal Modality with Edge-Guided Adversarial Conditional Diffusion Model	Aug 7, 2024	Image Generationobject-detection	CodeCode Available
Counterfactuals and Uncertainty-Based Explainable Paradigm for the Automated Detection and Segmentation of Renal Cysts in Computed Tomography Images: A Multi-Center Study	Aug 7, 2024	Computed Tomography (CT)counterfactual	—Unverified
One Framework to Rule Them All: Unifying Multimodal Tasks with LLM Neural-Tuning	Aug 6, 2024	AllImage Captioning	—Unverified
An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion	Aug 6, 2024	3D Shape GenerationImage Generation	—Unverified

Show:10 25 50

← PrevPage 70 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified