SOTAVerified|Agents Browse Leaderboard About

Personalized Image Generation

Utilizes single or multiple images that contain the same subject or style, along with text prompt, to generate images that contain that subject as well as match the textual description. Includes finetuning-based methods (e.g. DreamBooth, Textual Inversion) as well as encoder-based methods (e.g. E4T, ELITE, and IP-Adapter, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–58 of 58 papers

Title	Date	Tasks	Status
HiFi Tuner: High-Fidelity Subject-Driven Fine-Tuning for Diffusion Models	Nov 30, 2023	DenoisingImage Generation	—Unverified
IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models	Mar 20, 2024	DiversityImage Generation	—Unverified
HyperNet Fields: Efficiently Training Hypernetworks without Ground Truth by Learning Weight Trajectories	Dec 22, 2024	3D Shape ReconstructionImage Generation	—Unverified
Identity Encoder for Personalized Diffusion	Apr 14, 2023	Image EnhancementImage Generation	—Unverified
Imagine yourself: Tuning-Free Personalized Image Generation	Sep 20, 2024	DiversityImage Generation	—Unverified
InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning	Apr 6, 2023	Diffusion PersonalizationDiffusion Personalization Tuning Free	—Unverified
InstantFamily: Masked Attention for Zero-shot Multi-ID Image Generation	Apr 30, 2024	Face RecognitionImage Generation	—Unverified
Layout-and-Retouch: A Dual-stage Framework for Improving Diversity in Personalized Image Generation	Jul 13, 2024	DiversityImage Generation	—Unverified

Show:10 25 50

← PrevPage 6 of 6Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DreamBooth LoRA SDXL v1.0	Overall (CP * PF)	0.52	—	Unverified
2	IP-Adapter ViT-G SDXL v1.0	Overall (CP * PF)	0.38	—	Unverified
3	Emu2 SDXL v1.0	Overall (CP * PF)	0.36	—	Unverified
4	DreamBooth SD v1.5	Overall (CP * PF)	0.36	—	Unverified
5	IP-Adapter-Plus ViT-H SDXL v1.0	Overall (CP * PF)	0.34	—	Unverified
6	BLIP-Diffusion SD v1.5	Overall (CP * PF)	0.27	—	Unverified
7	Textual Inversion SD v1.5	Overall (CP * PF)	0.24	—	Unverified