Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 216 papers

Title	Date	Tasks	Status	Hype
Dataset Distillation with Neural Characteristic Function: A Minmax Perspective	Jan 1, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	3
DD-Ranking: Rethinking the Evaluation of Dataset Distillation	May 19, 2025	Data AugmentationData Compression	CodeCode Available	2
FedCache 2.0: Federated Edge Learning with Knowledge Caching and Dataset Distillation	May 22, 2024	Dataset DistillationFederated Learning	CodeCode Available	2
Self-supervised Dataset Distillation: A Good Compression Is All You Need	Apr 11, 2024	AllDataset Distillation	CodeCode Available	2
Dataset Quantization	Aug 21, 2023	Dataset Distillationobject-detection	CodeCode Available	2
Dataset Distillation by Matching Training Trajectories	Mar 22, 2022	Dataset DistillationDataset Distillation - 1IPC	CodeCode Available	2
Dataset Distillation via Vision-Language Category Prototype	Jun 30, 2025	Dataset DistillationDescriptive	CodeCode Available	1
FADRM: Fast and Accurate Data Residual Matching for Dataset Distillation	Jun 30, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	1
CaO_2: Rectifying Inconsistencies in Diffusion-Based Dataset Distillation	Jun 27, 2025	Dataset Distillation	CodeCode Available	1
Flowing Datasets with Wasserstein over Wasserstein Gradient Flows	Jun 9, 2025	Dataset DistillationDomain Adaptation	CodeCode Available	1
OD3: Optimization-free Dataset Distillation for Object Detection	Jun 2, 2025	Dataset Distillationimage-classification	CodeCode Available	1
Taming Diffusion for Dataset Distillation with High Representativeness	May 23, 2025	Dataset DistillationImage Generation	CodeCode Available	1
Distilling Dataset into Neural Field	Mar 5, 2025	Dataset Distillation	CodeCode Available	1
Dataset Distillation via Committee Voting	Jan 13, 2025	Dataset Distillation	CodeCode Available	1
A Large-Scale Study on Video Action Dataset Condensation	Dec 30, 2024	Action RecognitionDataset Condensation	CodeCode Available	1
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation	Nov 29, 2024	Dataset DistillationDiversity	CodeCode Available	1
Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios	Oct 22, 2024	Dataset Distillation	CodeCode Available	1
Are Large-scale Soft Labels Necessary for Large-scale Dataset Distillation?	Oct 21, 2024	Dataset DistillationDiversity	CodeCode Available	1
Generative Dataset Distillation Based on Diffusion Model	Aug 16, 2024	Data AugmentationDataset Distillation	CodeCode Available	1
Prioritize Alignment in Dataset Distillation	Aug 6, 2024	Dataset Distillation	CodeCode Available	1
D^4M: Dataset Distillation via Disentangled Diffusion Model	Jul 21, 2024	Dataset Distillation	CodeCode Available	1
Dataset Quantization with Active Learning based Adaptive Sampling	Jul 9, 2024	Active LearningDataset Distillation	CodeCode Available	1
A Label is Worth a Thousand Images in Dataset Distillation	Jun 15, 2024	Dataset Distillation	CodeCode Available	1
Low-Rank Similarity Mining for Multimodal Dataset Distillation	Jun 6, 2024	Contrastive LearningDataset Distillation	CodeCode Available	1
What is Dataset Distillation Learning?	Jun 6, 2024	Dataset Distillation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 9Next →

No leaderboard results yet.