Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 216 papers

Title	Date	Tasks	Status	Hype
Efficiency for Free: Ideal Data Are Transportable Representations	May 23, 2024	Dataset DistillationRepresentation Learning	CodeCode Available	1
GIFT: Unlocking Full Potential of Labels in Distilled Dataset at Near-zero Cost	May 23, 2024	Dataset Distillation	CodeCode Available	1
Exploiting Inter-sample and Inter-feature Relations in Dataset Distillation	Mar 31, 2024	Dataset Distillation	CodeCode Available	1
DiLM: Distilling Dataset into Language Model for Text-level Dataset Distillation	Mar 30, 2024	Dataset DistillationIn-Context Learning	CodeCode Available	1
Distilling Datasets Into Less Than One Image	Mar 18, 2024	Dataset CondensationDataset Distillation	CodeCode Available	1
Improve Cross-Architecture Generalization on Dataset Distillation	Feb 20, 2024	Dataset DistillationKnowledge Distillation	CodeCode Available	1
Group Distributionally Robust Dataset Distillation with Risk Minimization	Feb 7, 2024	Dataset DistillationFederated Learning	CodeCode Available	1
D^4: Dataset Distillation via Disentangled Diffusion Model	Jan 1, 2024	Dataset Distillation	CodeCode Available	1
On the Diversity and Realism of Distilled Dataset: An Efficient Dataset Distillation Paradigm	Dec 6, 2023	Dataset DistillationDiversity	CodeCode Available	1
Unlocking the Potential of Federated Learning: The Symphony of Dataset Distillation via Deep Generative Latents	Dec 3, 2023	Dataset DistillationFederated Learning	CodeCode Available	1
Dancing with Still Images: Video Distillation via Static-Dynamic Disentanglement	Dec 1, 2023	Dataset DistillationDisentanglement	CodeCode Available	1
Dataset Distillation via Curriculum Data Synthesis in Large Data Era	Nov 30, 2023	Data AugmentationDataset Distillation	CodeCode Available	1
Efficient Dataset Distillation via Minimax Diffusion	Nov 27, 2023	Dataset DistillationDiversity	CodeCode Available	1
Frequency Domain-based Dataset Distillation	Nov 15, 2023	Dataset Distillation	CodeCode Available	1
Embarassingly Simple Dataset Distillation	Nov 13, 2023	Bilevel OptimizationDataset Distillation	CodeCode Available	1
Label Poisoning is All You Need	Oct 29, 2023	AllBackdoor Attack	CodeCode Available	1
DREAM+: Efficient Dataset Distillation by Bidirectional Representative Matching	Oct 23, 2023	Dataset DistillationTransfer Learning	CodeCode Available	1
Does Graph Distillation See Like Vision Dataset Counterpart?	Oct 13, 2023	Anomaly DetectionDataset Distillation	CodeCode Available	1
Self-Supervised Dataset Distillation for Transfer Learning	Oct 10, 2023	Bilevel OptimizationDataset Distillation	CodeCode Available	1
Towards Lossless Dataset Distillation via Difficulty-Aligned Trajectory Matching	Oct 9, 2023	Dataset Distillation	CodeCode Available	1
Can pre-trained models assist in dataset distillation?	Oct 5, 2023	Dataset DistillationDiversity	CodeCode Available	1
DataDAM: Efficient Dataset Distillation with Attention Matching	Sep 29, 2023	Continual LearningDataset Distillation	CodeCode Available	1
Vision-Language Dataset Distillation	Aug 15, 2023	Dataset Distillationimage-classification	CodeCode Available	1
Towards Trustworthy Dataset Distillation	Jul 18, 2023	Dataset Distillation	CodeCode Available	1
Squeeze, Recover and Relabel: Dataset Condensation at ImageNet Scale From A New Perspective	Jun 22, 2023	Bilevel OptimizationDataset Condensation	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 9Next →

No leaderboard results yet.