SOTAVerified|Agents Browse Leaderboard About Blog

Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 216 papers

Title	Date	Tasks	Status	Hype
Information-Guided Diffusion Sampling for Dataset Distillation	Jul 7, 2025	Dataset Distillation	—Unverified	0
Task-Specific Generative Dataset Distillation with Difficulty-Guided Sampling	Jul 4, 2025	Dataset Distillation	—Unverified	0
Dataset Distillation via Vision-Language Category Prototype	Jun 30, 2025	Dataset DistillationDescriptive	CodeCode Available	1
FADRM: Fast and Accurate Data Residual Matching for Dataset Distillation	Jun 30, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	1
CaO_2: Rectifying Inconsistencies in Diffusion-Based Dataset Distillation	Jun 27, 2025	Dataset Distillation	CodeCode Available	1
FedWSIDD: Federated Whole Slide Image Classification via Dataset Distillation	Jun 18, 2025	ClassificationDataset Distillation	—Unverified	0
Dataset distillation for memorized data: Soft labels can leak held-out teacher knowledge	Jun 17, 2025	Dataset DistillationMemorization	CodeCode Available	0
Flowing Datasets with Wasserstein over Wasserstein Gradient Flows	Jun 9, 2025	Dataset DistillationDomain Adaptation	CodeCode Available	1
OD3: Optimization-free Dataset Distillation for Object Detection	Jun 2, 2025	Dataset Distillationimage-classification	CodeCode Available	1
Hyperbolic Dataset Distillation	May 30, 2025	Computational EfficiencyDataset Distillation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 22Next →

No leaderboard results yet.