Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 6689 papers

Title	Date	Tasks	Status
AR-RAG: Autoregressive Retrieval Augmentation for Image Generation	Jun 8, 2025	Image Generationparameter-efficient fine-tuning	CodeCode Available
Training-Free Identity Preservation in Stylized Image Generation Using Diffusion Models	Jun 7, 2025	Image GenerationStyle Transfer	—Unverified
ResPF: Residual Poisson Flow for Efficient and Physically Consistent Sparse-View CT Reconstruction	Jun 6, 2025	Computed Tomography (CT)CT Reconstruction	—Unverified
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery	Jun 6, 2025	Hyperparameter OptimizationImage Generation	CodeCode Available
Noise Consistency Regularization for Improved Subject-Driven Image Synthesis	Jun 6, 2025	DiversityImage Generation	—Unverified
PixCell: A generative foundation model for digital histopathology images	Jun 5, 2025	Cell SegmentationData Augmentation	—Unverified
Invisible Backdoor Triggers in Image Editing Model via Deep Watermarking	Jun 5, 2025	Backdoor AttackImage Generation	CodeCode Available
Improving AI-generated music with user-guided training	Jun 5, 2025	Image GenerationMusic Generation	—Unverified
Aligning Latent Spaces with Flow Priors	Jun 5, 2025	Image Generation	—Unverified
ContentV: Efficient Training of Video Generation Models with Limited Compute	Jun 5, 2025	Image GenerationVideo Generation	—Unverified
Is Perturbation-Based Image Protection Disruptive to Image Editing?	Jun 4, 2025	Image GenerationMisinformation	—Unverified
Backbone Augmented Training for Adaptations	Jun 4, 2025	Image GenerationText Generation	—Unverified
ControlThinker: Unveiling Latent Semantics for Controllable Image Generation through Visual Reasoning	Jun 4, 2025	Image GenerationVisual Reasoning	CodeCode Available
HMAR: Efficient Hierarchical Masked Auto-Regressive Image Generation	Jun 4, 2025	AllImage Generation	—Unverified
Flexiffusion: Training-Free Segment-Wise Neural Architecture Search for Efficient Diffusion Models	Jun 3, 2025	Image GenerationNeural Architecture Search	—Unverified
Solving Inverse Problems with FLAIR	Jun 3, 2025	Image GenerationText to Image Generation	—Unverified
Hyperspectral Image Generation with Unmixing Guided Diffusion Model	Jun 3, 2025	Hyperspectral UnmixingImage Generation	—Unverified
Absorb and Converge: Provable Convergence Guarantee for Absorbing Discrete Diffusion Models	Jun 2, 2025	Image Generation	—Unverified
A 2-Stage Model for Vehicle Class and Orientation Detection with Photo-Realistic Image Generation	Jun 2, 2025	Image Generation	—Unverified
PointT2I: LLM-based text-to-image generation via keypoints	Jun 2, 2025	Image GenerationLarge Language Model	—Unverified
Image Generation from Contextually-Contradictory Prompts	Jun 2, 2025	DenoisingImage Generation	—Unverified
Unlocking Aha Moments via Reinforcement Learning: Advancing Collaborative Visual Comprehension and Generation	Jun 2, 2025	Image GenerationText to Image Generation	—Unverified
TaxaDiffusion: Progressively Trained Diffusion Model for Fine-Grained Species Generation	Jun 2, 2025	Image GenerationTransfer Learning	CodeCode Available
Psi-Sampler: Initial Particle Sampling for SMC-Based Inference-Time Reward Alignment in Score Models	Jun 2, 2025	DenoisingImage Generation	—Unverified
OG-VLA: 3D-Aware Vision Language Action Model via Orthographic Image Generation	Jun 1, 2025	Image GenerationLarge Language Model	—Unverified
ArtiScene: Language-Driven Artistic 3D Scene Generation Through Image Intermediary	May 31, 2025	3D GenerationImage Generation	—Unverified
Latent Wavelet Diffusion: Enabling 4K Image Synthesis for Free	May 31, 2025	2k4k	—Unverified
Category-aware EEG image generation based on wavelet transform and contrast semantic loss	May 30, 2025	EEGImage Generation	CodeCode Available
GenSpace: Benchmarking Spatially-Aware Image Generation	May 30, 2025	BenchmarkingImage Generation	—Unverified
Graph Flow Matching: Enhancing Image Generation with Neighbor-Aware Flow Fields	May 30, 2025	Image Generation	—Unverified
Interpreting Large Text-to-Image Diffusion Models with Dictionary Learning	May 30, 2025	Dictionary LearningImage Generation	CodeCode Available
ComposeAnything: Composite Object Priors for Text-to-Image Generation	May 30, 2025	DenoisingImage Generation	—Unverified
How Animals Dance (When You're Not Looking)	May 29, 2025	Image Generation	—Unverified
VITON-DRR: Details Retention Virtual Try-on via Non-rigid Registration	May 29, 2025	Image GenerationSemantic Segmentation	CodeCode Available
Multi-Group Proportional Representation for Text-to-Image Models	May 29, 2025	Image Generation	—Unverified
VisualSphinx: Large-Scale Synthetic Vision Logic Puzzles for RL	May 29, 2025	Arithmetic ReasoningImage Generation	—Unverified
Dimension-Reduction Attack! Video Generative Models are Experts on Controllable Image Synthesis	May 29, 2025	Dimensionality ReductionImage Generation	—Unverified
Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering	May 29, 2025	DenoisingImage Generation	CodeCode Available
Image Aesthetic Reasoning: A New Benchmark for Medical Image Screening with MLLMs	May 29, 2025	Image GenerationMultiple-choice	—Unverified
LoRAShop: Training-Free Multi-Concept Image Generation and Editing with Rectified Flow Transformers	May 29, 2025	DenoisingImage Generation	—Unverified
Inference-time Scaling of Diffusion Models through Classical Search	May 29, 2025	Image GenerationNavigate	—Unverified
Implicit Inversion turns CLIP into a Decoder	May 29, 2025	DecoderImage Generation	CodeCode Available
R2I-Bench: Benchmarking Reasoning-Driven Text-to-Image Generation	May 29, 2025	BenchmarkingImage Generation	—Unverified
RSFAKE-1M: A Large-Scale Dataset for Detecting Diffusion-Generated Remote Sensing Forgeries	May 29, 2025	Image Generation	—Unverified
Principled Out-of-Distribution Generalization via Simplicity	May 28, 2025	Image GenerationOut-of-Distribution Generalization	—Unverified
Rhetorical Text-to-Image Generation via Two-layer Diffusion Policy Optimization	May 28, 2025	DenoisingImage Generation	—Unverified
Cross-modal RAG: Sub-dimensional Retrieval-Augmented Text-to-Image Generation	May 28, 2025	Image GenerationLanguage Modeling	CodeCode Available
Uni-Instruct: One-step Diffusion Model through Unified Diffusion Divergence Instruction	May 27, 2025	3D GenerationImage Generation	—Unverified
Unveiling Impact of Frequency Components on Membership Inference Attacks for Diffusion Models	May 27, 2025	Image Generation	—Unverified
Creativity in LLM-based Multi-Agent Systems: A Survey	May 27, 2025	Image GenerationLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 45 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified