Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3850 of 6689 papers

Title	Date	Tasks	Status
SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration	Apr 30, 2024	Image Generation	—Unverified
DOCCI: Descriptions of Connected and Contrasting Images	Apr 30, 2024	Image GenerationImage to text	—Unverified
NeRF-Insert: 3D Local Editing with Multimodal Control Signals	Apr 30, 2024	Image GenerationNeRF	—Unverified
InstantFamily: Masked Attention for Zero-shot Multi-ID Image Generation	Apr 30, 2024	Face RecognitionImage Generation	—Unverified
PKU-AIGIQA-4K: A Perceptual Quality Assessment Database for Both Text-to-Image and Image-to-Image AI-Generated Images	Apr 29, 2024	4kImage Generation	CodeCode Available
Learning Mixtures of Gaussians Using Diffusion Models	Apr 29, 2024	Image Generation	—Unverified
Anywhere: A Multi-Agent Framework for User-Guided, Reliable, and Diverse Foreground-Conditioned Image Generation	Apr 29, 2024	DiversityImage Generation	—Unverified
A robust and scalable framework for hallucination detection in virtual tissue staining and digital pathology	Apr 29, 2024	HallucinationImage Generation	—Unverified
Hide and Seek: How Does Watermarking Impact Face Recognition?	Apr 29, 2024	Data AugmentationDecoder	—Unverified
Improving Training-free Conditional Diffusion Model via Fisher Information	Apr 28, 2024	Conditional Image GenerationImage Generation	—Unverified
Grounded Compositional and Diverse Text-to-3D with Pretrained Multi-View Diffusion Model	Apr 28, 2024	Image GenerationText to 3D	—Unverified
Synthesizing Iris Images using Generative Adversarial Networks: Survey and Comparative Analysis	Apr 26, 2024	Image GenerationIris Recognition	—Unverified
BlenderAlchemy: Editing 3D Graphics with Vision-Language Models	Apr 26, 2024	Game DesignImage Generation	—Unverified
Efficient Exploration of Image Classifier Failures with Bayesian Optimization and Text-to-Image Models	Apr 26, 2024	AttributeBayesian Optimization	—Unverified
LM-IGTD: a 2D image generator for low-dimensional and mixed-type tabular data to leverage the potential of convolutional neural networks	Apr 26, 2024	Image GenerationMulti-class Classification	—Unverified
Trinity Detector:text-assisted and attention mechanisms based spectral fusion for diffusion generation image detection	Apr 26, 2024	Image GenerationText to Image Generation	—Unverified
Conditional Distribution Modelling for Few-Shot Image Synthesis with Diffusion Models	Apr 25, 2024	DiversityImage Generation	—Unverified
MuseumMaker: Continual Style Customization without Catastrophic Forgetting	Apr 25, 2024	Image Generation	—Unverified
Sketch2Human: Deep Human Generation with Disentangled Geometry and Appearance Control	Apr 24, 2024	Face GenerationImage Generation	—Unverified
ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning	Apr 23, 2024	Face DetectionImage Generation	—Unverified
SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models	Apr 23, 2024	DiagnosticHallucination	—Unverified
GLoD: Composing Global Contexts and Local Details in Image Generation	Apr 23, 2024	DenoisingImage Generation	—Unverified
Multimodal Large Language Model is a Human-Aligned Annotator for Text-to-Image Generation	Apr 23, 2024	Image GenerationLanguage Modeling	—Unverified
FINEMATCH: Aspect-based Fine-grained Image and Text Mismatch Detection and Correction	Apr 23, 2024	HallucinationImage Generation	—Unverified
Towards Better Text-to-Image Generation Alignment via Attention Modulation	Apr 22, 2024	AttributeImage Generation	—Unverified
Accelerating Image Generation with Sub-path Linear Approximation Model	Apr 22, 2024	DenoisingGPU	—Unverified
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis	Apr 21, 2024	Image Generation	—Unverified
LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation	Apr 21, 2024	Image GenerationImage Morphing	—Unverified
Enforcing Conditional Independence for Fair Representation Learning and Causal Image Generation	Apr 21, 2024	AttributeFairness	—Unverified
Concept Arithmetics for Circumventing Concept Inhibition in Diffusion Models	Apr 21, 2024	ARCImage Generation	—Unverified
Object-Attribute Binding in Text-to-Image Generation: Evaluation and Control	Apr 21, 2024	AttributeImage Generation	—Unverified
LTOS: Layout-controllable Text-Object Synthesis via Adaptive Cross-attention Fusions	Apr 21, 2024	Image GenerationLayout-to-Image Generation	—Unverified
High-fidelity Endoscopic Image Synthesis by Utilizing Depth-guided Neural Surfaces	Apr 20, 2024	Camera LocalizationDepth Estimation	—Unverified
Generative Modelling with High-Order Langevin Dynamics	Apr 19, 2024	Image GenerationUnconditional Image Generation	—Unverified
DragTraffic: Interactive and Controllable Traffic Scene Generation for Autonomous Driving	Apr 19, 2024	Autonomous DrivingDiversity	—Unverified
Neural Flow Diffusion Models: Learnable Forward Process for Improved Diffusion Modelling	Apr 19, 2024	Image Generation	CodeCode Available
DensePANet: An improved generative adversarial network for photoacoustic tomography image reconstruction from sparse data	Apr 19, 2024	Generative Adversarial NetworkImage Generation	—Unverified
PATE-TripleGAN: Privacy-Preserving Image Synthesis with Gaussian Differential Privacy	Apr 19, 2024	Image GenerationPrivacy Preserving	—Unverified
How Real Is Real? A Human Evaluation Framework for Unrestricted Adversarial Examples	Apr 19, 2024	Autonomous VehiclesImage Generation	—Unverified
EdgeFusion: On-Device Text-to-Image Generation	Apr 18, 2024	Image GenerationKnowledge Distillation	—Unverified
LD-Pruner: Efficient Pruning of Latent Diffusion Models using Task-Agnostic Insights	Apr 18, 2024	Audio GenerationImage Generation	—Unverified
Multi-view X-ray Image Synthesis with Multiple Domain Disentanglement from CT Scans	Apr 18, 2024	DisentanglementImage Generation	—Unverified
Image Generative Semantic Communication with Multi-Modal Similarity Estimation for Resource-Limited Networks	Apr 17, 2024	Image CompressionImage Generation	—Unverified
Multi-Sensor Diffusion-Driven Optical Image Translation for Large-Scale Applications	Apr 17, 2024	Change DetectionDenoising	—Unverified
Diffusion Schrödinger Bridge Models for High-Quality MR-to-CT Synthesis for Head and Neck Proton Treatment Planning	Apr 17, 2024	Image Generation	—Unverified
MoA: Mixture-of-Attention for Subject-Context Disentanglement in Personalized Image Generation	Apr 17, 2024	DisentanglementImage Generation	—Unverified
On the Scalability of GNNs for Molecular Graphs	Apr 17, 2024	DiversityDrug Discovery	—Unverified
OneActor: Consistent Character Generation via Cluster-Conditioned Guidance	Apr 16, 2024	Consistent Character GenerationDenoising	—Unverified
OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model	Apr 16, 2024	DenoisingDomain Generalization	—Unverified
Adversarial Identity Injection for Semantic Face Image Synthesis	Apr 16, 2024	Adversarial AttackFace Generation	—Unverified

Show:10 25 50

← PrevPage 77 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified