Image Generation

Image Generation (synthesis) is the task of generating new images from an existing dataset.

Unconditional generation refers to generating samples unconditionally from the dataset, i.e. $p(y)$
Conditional image generation (subtask) refers to generating samples conditionally from the dataset, based on a label, i.e. $p(y|x)$.

In this section, you can find state-of-the-art leaderboards for unconditional generation. For conditional generation, and other types of image generations, refer to the subtasks.

( Image credit: StyleGAN )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3351–3400 of 6689 papers

Title	Date	Tasks	Status
Pixel-Space Post-Training of Latent Diffusion Models	Sep 26, 2024	Image Generation	—Unverified
ID^3: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition	Sep 26, 2024	DiversityFace Recognition	—Unverified
Pioneering Reliable Assessment in Text-to-Image Knowledge Editing: Leveraging a Fine-Grained Dataset and an Innovative Criterion	Sep 26, 2024	Image GenerationIn-Context Learning	CodeCode Available
DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models	Sep 26, 2024	Autonomous DrivingDenoising	—Unverified
AnyLogo: Symbiotic Subject-Driven Diffusion System with Gemini Status	Sep 26, 2024	DenoisingImage Generation	—Unverified
Text Image Generation for Low-Resource Languages with Dual Translation Learning	Sep 26, 2024	DiversityImage Generation	—Unverified
JoyType: A Robust Design for Multilingual Visual Text Creation	Sep 26, 2024	Image GenerationOptical Character Recognition (OCR)	—Unverified
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design	Sep 25, 2024	Image GenerationPrompt Engineering	—Unverified
Pose-Guided Fine-Grained Sign Language Video Generation	Sep 25, 2024	Image GenerationOptical Flow Estimation	—Unverified
Morphological-consistent Diffusion Network for Ultrasound Coronal Image Enhancement	Sep 25, 2024	Image EnhancementImage Generation	—Unverified
Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients	Sep 24, 2024	Contrastive LearningImage Generation	—Unverified
Deep chroma compression of tone-mapped images	Sep 24, 2024	Generative Adversarial NetworkImage Generation	CodeCode Available
Improvements to SDXL in NovelAI Diffusion V3	Sep 24, 2024	Image Generation	—Unverified
FaceVid-1K: A Large-Scale High-Quality Multiracial Human Face Video Dataset	Sep 23, 2024	Image GenerationUnconditional Video Generation	—Unverified
Can CLIP Count Stars? An Empirical Study on Quantity Bias in CLIP	Sep 23, 2024	Image GenerationQuestion Answering	—Unverified
EDGE-Rec: Efficient and Data-Guided Edge Diffusion For Recommender Systems Graphs	Sep 23, 2024	Collaborative FilteringDenoising	—Unverified
Advancing Video Quality Assessment for AIGC	Sep 23, 2024	Image GenerationText Generation	—Unverified
DepthART: Monocular Depth Estimation as Autoregressive Refinement Task	Sep 23, 2024	Depth EstimationImage Generation	—Unverified
Fine Tuning Text-to-Image Diffusion Models for Correcting Anomalous Images	Sep 23, 2024	Image GenerationSSIM	CodeCode Available
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified
LatentQGAN: A Hybrid QGAN with Classical Convolutional Autoencoder	Sep 22, 2024	Anomaly DetectionImage Generation	—Unverified
Implicit Dynamical Flow Fusion (IDFF) for Generative Modeling	Sep 22, 2024	Image GenerationTime Series	CodeCode Available
Adversarial Attacks on Parts of Speech: An Empirical Study in Text-to-Image Generation	Sep 21, 2024	Adversarial AttackImage Generation	CodeCode Available
Recovering Global Data Distribution Locally in Federated Learning	Sep 21, 2024	Federated Learningimage-classification	—Unverified
BrainDreamer: Reasoning-Coherent and Controllable Image Generation from EEG Brain Signals via Language Guidance	Sep 21, 2024	Contrastive LearningEEG	—Unverified
Efficient Visualization of Neural Networks with Generative Models and Adversarial Perturbations	Sep 20, 2024	Image Generation	—Unverified
Imagine yourself: Tuning-Free Personalized Image Generation	Sep 20, 2024	DiversityImage Generation	—Unverified
Improving Cone-Beam CT Image Quality with Knowledge Distillation-Enhanced Diffusion Model in Imbalanced Data Settings	Sep 19, 2024	Computed Tomography (CT)Image Generation	—Unverified
Tracking Any Point with Frame-Event Fusion Network at High Frame Rate	Sep 18, 2024	Image GenerationPoint Tracking	CodeCode Available
RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets	Sep 18, 2024	Image GenerationState Estimation	—Unverified
Recommendation with Generative Models	Sep 18, 2024	Image GenerationNavigate	—Unverified
ChefFusion: Multimodal Foundation Model Integrating Recipe and Food Image Generation	Sep 18, 2024	DecoderFood Recognition	CodeCode Available
GUNet: A Graph Convolutional Network United Diffusion Model for Stable and Diversity Pose Generation	Sep 18, 2024	DenoisingDiversity	—Unverified
Agglomerative Token Clustering	Sep 18, 2024	Clusteringimage-classification	—Unverified
Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation	Sep 18, 2024	Image Generation	—Unverified
Improving the Efficiency of Visually Augmented Language Models	Sep 17, 2024	Image GenerationImage Retrieval	CodeCode Available
Using Physics Informed Generative Adversarial Networks to Model 3D porous media	Sep 17, 2024	Image Generation	—Unverified
Cross-modality image synthesis from TOF-MRA to CTA using diffusion-based models	Sep 16, 2024	DiagnosticImage Generation	—Unverified
On Synthetic Texture Datasets: Challenges, Creation, and Curation	Sep 16, 2024	Image GenerationTexture Synthesis	—Unverified
MotionCom: Automatic and Motion-Aware Image Composition with LLM and Video Diffusion Prior	Sep 16, 2024	Image GenerationLanguage Modeling	CodeCode Available
SimInversion: A Simple Framework for Inversion-Based Text-to-Image Editing	Sep 16, 2024	Image Generation	—Unverified
2S-ODIS: Two-Stage Omni-Directional Image Synthesis by Geometric Distortion Correction	Sep 16, 2024	distortion correctionERP	CodeCode Available
VAE-QWGAN: Addressing Mode Collapse in Quantum GANs via Autoencoding Priors	Sep 16, 2024	DecoderDiversity	—Unverified
Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through f-divergence Minimization	Sep 15, 2024	DiversityImage Generation	—Unverified
E-Commerce Inpainting with Mask Guidance in Controlnet for Reducing Overcompletion	Sep 15, 2024	Image Generation	—Unverified
GRIN: Zero-Shot Metric Depth with Pixel-Level Diffusion	Sep 15, 2024	3D ReconstructionDepth Estimation	—Unverified
Beta-Sigma VAE: Separating beta and decoder variance in Gaussian variational autoencoder	Sep 14, 2024	DecoderImage Generation	CodeCode Available
GroundingBooth: Grounding Text-to-Image Customization	Sep 13, 2024	Image Generation	—Unverified
Enhancing Privacy in ControlNet and Stable Diffusion via Split Learning	Sep 13, 2024	Federated LearningImage Generation	—Unverified
InstantDrag: Improving Interactivity in Drag-based Image Editing	Sep 13, 2024	Image GenerationMotion Generation	—Unverified

Show:10 25 50

← PrevPage 68 of 134Next →

All datasets ImageNet 256x256 CIFAR-10 ImageNet 64x64 ImageNet 512x512 FFHQ 256 x 256 CelebA 64x64 ImageNet 32x32 LSUN Bedroom 256 x 256 STL-10 LSUN Churches 256 x 256 ImageNet 128x128 FFHQ 1024 x 1024

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Improved DDPM	FID	12.3	—	Unverified
2	ADM	FID	11.84	—	Unverified
3	BigGAN-deep	FID	8.1	—	Unverified
4	Polarity-BigGAN	FID	6.82	—	Unverified
5	VQGAN+Transformer (k=mixed, p=1.0, a=0.005)	FID	6.59	—	Unverified
6	MaskGIT	FID	6.18	—	Unverified
7	VQGAN+Transformer (k=600, p=1.0, a=0.05)	FID	5.2	—	Unverified
8	CDM	FID	4.88	—	Unverified
9	ADM-G	FID	4.59	—	Unverified
10	RIN	FID	4.51	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PresGAN	FID	52.2	—	Unverified
2	RESFLOW	FID	48.29	—	Unverified
3	Residual Flow	FID	46.37	—	Unverified
4	GLF+perceptual loss (ours)	FID	44.6	—	Unverified
5	ProdPoly no activation functions	FID	40.45	—	Unverified
6	ProdPoly no activation functions	FID	36.77	—	Unverified
7	ACGAN	FID	35.47	—	Unverified
8	DenseFlow-74-10	FID	34.9	—	Unverified
9	NVAE w/ flow	FID	32.53	—	Unverified
10	QSNGAN	FID	31.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GLIDE + CLS	FID	30.87	—	Unverified
2	GLIDE + CLIP	FID	30.46	—	Unverified
3	GLIDE + CLS-FREE	FID	29.22	—	Unverified
4	GLIDE + CLIP + CLS + CLS-FREE	FID	29.18	—	Unverified
5	PGMGAN	FID	21.73	—	Unverified
6	CLR-GAN	FID	20.27	—	Unverified
7	FM	FID	14.45	—	Unverified
8	CT (Direct Generation, NFE=1)	FID	13	—	Unverified
9	CT (Direct Generation, NFE=2)	FID	11.1	—	Unverified
10	GLIDE +CLS	KID	7.95	—	Unverified