Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2450 of 6689 papers

Title	Date	Tasks	Status
Privacy Protection Against Personalized Text-to-Image Synthesis via Cross-image Consistency Constraints	Apr 17, 2025	Image Generation	—Unverified
SMPL-GPTexture: Dual-View 3D Human Texture Estimation using Text-to-Image Generation Models	Apr 17, 2025	Human Mesh RecoveryImage Generation	—Unverified
HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation	Apr 17, 2025	3D GenerationImage Generation	—Unverified
ForgetMe: Evaluating Selective Forgetting in Generative Models	Apr 17, 2025	Image GenerationPrivacy Preserving	—Unverified
Cobra: Efficient Line Art COlorization with BRoAder References	Apr 16, 2025	ColorizationImage Generation	—Unverified
Anti-Aesthetics: Protecting Facial Privacy against Customized Text-to-Image Synthesis	Apr 16, 2025	Image Generation	—Unverified
Instruction-augmented Multimodal Alignment for Image-Text and Element Matching	Apr 16, 2025	Image AugmentationImage Generation	—Unverified
Beyond Reconstruction: A Physics Based Neural Deferred Shader for Photo-realistic Rendering	Apr 16, 2025	Image Generation	—Unverified
Novel-view X-ray Projection Synthesis through Geometry-Integrated Deep Learning	Apr 16, 2025	AnatomyDecision Making	CodeCode Available
SIDME: Self-supervised Image Demoiréing via Masked Encoder-Decoder Reconstruction	Apr 16, 2025	DecoderImage Generation	—Unverified
Wavelet-based Variational Autoencoders for High-Resolution Image Generation	Apr 16, 2025	Image Generation	—Unverified
Towards Safe Synthetic Image Generation On the Web: A Multimodal Robust NSFW Defense and Million Scale Dataset	Apr 16, 2025	Adversarial AttackImage Generation	CodeCode Available
ACE: Attentional Concept Erasure in Diffusion Models	Apr 16, 2025	Image GenerationSpecificity	—Unverified
Synthetic Data for Blood Vessel Network Extraction	Apr 16, 2025	Graph GenerationImage Generation	—Unverified
Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models	Apr 15, 2025	DenoisingGPU	—Unverified
ADT: Tuning Diffusion Models with Adversarial Supervision	Apr 15, 2025	DenoisingImage Generation	—Unverified
AnimeDL-2M: Million-Scale AI-Generated Anime Image Detection and Localization in Diffusion Era	Apr 15, 2025	Image GenerationImage Manipulation	—Unverified
Seedream 3.0 Technical Report	Apr 15, 2025	2kImage Generation	—Unverified
Using LLMs as prompt modifier to avoid biases in AI image generators	Apr 15, 2025	DiversityImage Generation	—Unverified
Omni^2: Unifying Omnidirectional Image Generation and Editing in an Omni Model	Apr 15, 2025	Image Generation	—Unverified
Art3D: Training-Free 3D Generation from Flat-Colored Illustration	Apr 14, 2025	3D GenerationImage Generation	—Unverified
InstructEngine: Instruction-driven Text-to-Image Alignment	Apr 14, 2025	Image GenerationText to Image Generation	—Unverified
Towards Explainable Partial-AIGC Image Quality Assessment	Apr 12, 2025	Image GenerationImage Manipulation	—Unverified
seg2med: a bridge from artificial anatomy to multimodal medical images	Apr 12, 2025	AnatomyData Augmentation	—Unverified
MixDiT: Accelerating Image Diffusion Transformer Inference with Mixed-Precision MX Quantization	Apr 11, 2025	Image GenerationQuantization	—Unverified
Discriminator-Free Direct Preference Optimization for Video Diffusion	Apr 11, 2025	Image Generation	—Unverified
On the Design of Diffusion-based Neural Speech Codecs	Apr 11, 2025	Audio GenerationImage Generation	—Unverified
CoProSketch: Controllable and Progressive Sketch Generation with Diffusion Model	Apr 11, 2025	Image Generation	—Unverified
Generating Fine Details of Entity Interactions	Apr 11, 2025	Image Generation	—Unverified
Muon-Accelerated Attention Distillation for Real-Time Edge Synthesis via Optimized Latent Diffusion	Apr 11, 2025	Image GenerationQuantization	—Unverified
Marmot: Multi-Agent Reasoning for Multi-Object Self-Correcting in Improving Image-Text Alignment	Apr 10, 2025	AI AgentAttribute	—Unverified
DiverseFlow: Sample-Efficient Diverse Mode Coverage in Flows	Apr 10, 2025	DiversityImage Generation	—Unverified
POEM: Precise Object-level Editing via MLLM control	Apr 10, 2025	Image GenerationObject	—Unverified
Model Discrepancy Learning: Synthetic Faces Detection Based on Multi-Reconstruction	Apr 10, 2025	Face DetectionImage Generation	—Unverified
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning	Apr 10, 2025	Image GenerationIn-Context Learning	—Unverified
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation	Apr 10, 2025	Image Generation	—Unverified
Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability	Apr 9, 2025	Image Generationmultimodal generation	—Unverified
PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering	Apr 9, 2025	Image Generation	—Unverified
Compass Control: Multi Object Orientation Control for Text-to-Image Generation	Apr 9, 2025	Image GenerationObject	—Unverified
Transfer between Modalities with MetaQueries	Apr 8, 2025	Decoder	—Unverified
Storybooth: Training-free Multi-Subject Consistency for Improved Visual Storytelling	Apr 8, 2025	Image GenerationText to Image Generation	—Unverified
Parasite: A Steganography-based Backdoor Attack Framework for Diffusion Models	Apr 8, 2025	Backdoor AttackImage Generation	—Unverified
CDM-QTA: Quantized Training Acceleration for Efficient LoRA Fine-Tuning of Diffusion Model	Apr 8, 2025	Image Generation	—Unverified
D-Feat Occlusions: Diffusion Features for Robustness to Partial Visual Occlusions in Object Recognition	Apr 8, 2025	Image GenerationObject	—Unverified
A Training-Free Style-aligned Image Generation with Scale-wise Autoregressive Model	Apr 8, 2025	Image Generation	—Unverified
Generative Adversarial Networks with Limited Data: A Survey and Benchmarking	Apr 7, 2025	BenchmarkingImage Generation	—Unverified
Multimodal Cinematic Video Synthesis Using Text-to-Image and Audio Generation Models	Apr 6, 2025	Audio GenerationGPU	—Unverified
Thermoxels: a voxel-based method to generate simulation-ready 3D thermal models	Apr 6, 2025	3D ReconstructionImage Generation	—Unverified
Digital Gene: Learning about the Physical World through Analytic Concepts	Apr 5, 2025	Image Generationobject-detection	—Unverified
Dynamic Importance in Diffusion U-Net for Enhanced Image Synthesis	Apr 4, 2025	DenoisingImage Generation	CodeCode Available

Show:10 25 50

← PrevPage 49 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified