Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 216 papers

Title	Date	Tasks	Status	Hype	Score
A Label is Worth a Thousand Images in Dataset Distillation	Jun 15, 2024	Dataset Distillation	CodeCode Available	1	5
Scaling Up Dataset Distillation to ImageNet-1K with Constant Memory	Nov 19, 2022	Dataset DistillationDataset Distillation - 1IPC	CodeCode Available	1	5
Towards Trustworthy Dataset Distillation	Jul 18, 2023	Dataset Distillation	CodeCode Available	1	5
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation	Nov 29, 2024	Dataset DistillationDiversity	CodeCode Available	1	5
Efficient Dataset Distillation Using Random Feature Approximation	Oct 21, 2022	Dataset CondensationDataset Distillation	CodeCode Available	1	5
Dataset Distillation via Factorization	Oct 30, 2022	Dataset DistillationHallucination	CodeCode Available	1	5
D^4M: Dataset Distillation via Disentangled Diffusion Model	Jul 21, 2024	Dataset Distillation	CodeCode Available	1	5
A Large-Scale Study on Video Action Dataset Condensation	Dec 30, 2024	Action RecognitionDataset Condensation	CodeCode Available	1	5
Dataset Distillation via Vision-Language Category Prototype	Jun 30, 2025	Dataset DistillationDescriptive	CodeCode Available	1	5
Dataset Distillation with Convexified Implicit Gradients	Feb 13, 2023	Dataset DistillationDataset Distillation - 1IPC	CodeCode Available	1	5
DREAM+: Efficient Dataset Distillation by Bidirectional Representative Matching	Oct 23, 2023	Dataset DistillationTransfer Learning	CodeCode Available	1	5
Generative Dataset Distillation Based on Diffusion Model	Aug 16, 2024	Data AugmentationDataset Distillation	CodeCode Available	1	5
DataDAM: Efficient Dataset Distillation with Attention Matching	Sep 29, 2023	Continual LearningDataset Distillation	CodeCode Available	1	5
Embarassingly Simple Dataset Distillation	Nov 13, 2023	Bilevel OptimizationDataset Distillation	CodeCode Available	1	5
Dataset Factorization for Condensation	Nov 1, 2022	Dataset DistillationDiversity	CodeCode Available	1	5
Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios	Oct 22, 2024	Dataset Distillation	CodeCode Available	1	5
Dataset Distillation with Infinitely Wide Convolutional Networks	Jul 27, 2021	Dataset Distillationimage-classification	CodeCode Available	0	5
Behaviour Distillation	Jun 21, 2024	Continual Learningcontinuous-control	CodeCode Available	0	5
BEARD: Benchmarking the Adversarial Robustness for Dataset Distillation	Nov 14, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	0	5
Dataset Distillation via Knowledge Distillation: Towards Efficient Self-Supervised Pre-Training of Deep Networks	Oct 3, 2024	Dataset DistillationKnowledge Distillation	CodeCode Available	0	5
Dataset Distillation via Adversarial Prediction Matching	Dec 14, 2023	Dataset DistillationGPU	CodeCode Available	0	5
Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation	Mar 24, 2025	Dataset Distillation	CodeCode Available	0	5
Dataset Distillation using Neural Feature Regression	Jun 1, 2022	Continual LearningDataset Distillation	CodeCode Available	0	5
CONCORD: Concept-Informed Diffusion for Dataset Distillation	May 23, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	0	5
BACON: Bayesian Optimal Condensation Framework for Dataset Distillation	Jun 3, 2024	Dataset Distillation	CodeCode Available	0	5
AST: Effective Dataset Distillation through Alignment with Smooth and High-Quality Expert Trajectories	Oct 16, 2023	Dataset Distillation	CodeCode Available	0	5
Risk of Text Backdoor Attacks Under Dataset Distillation	Oct 17, 2024	Backdoor AttackDataset Distillation	CodeCode Available	0	5
Sequential Subset Matching for Dataset Distillation	Nov 2, 2023	Dataset Distillation	CodeCode Available	0	5
TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation	Feb 5, 2025	Dataset DistillationMeta-Learning	CodeCode Available	0	5
ATOM: Attention Mixer for Efficient Dataset Distillation	May 2, 2024	Dataset DistillationNeural Architecture Search	CodeCode Available	0	5
Does Training with Synthetic Data Truly Protect Privacy?	Feb 18, 2025	Data-free Knowledge DistillationDataset Distillation	CodeCode Available	0	5
Dataset Distillation for Offline Reinforcement Learning	Jul 29, 2024	Dataset Distillationreinforcement-learning	CodeCode Available	0	5
Dataset distillation for memorized data: Soft labels can leak held-out teacher knowledge	Jun 17, 2025	Dataset DistillationMemorization	CodeCode Available	0	5
Color-Oriented Redundancy Reduction in Dataset Distillation	Nov 18, 2024	Dataset Distillation	CodeCode Available	0	5
Distributional Dataset Distillation with Subtask Decomposition	Mar 1, 2024	Dataset DistillationDecoder	CodeCode Available	0	5
Neural Spectral Decomposition for Dataset Distillation	Aug 29, 2024	Dataset Distillation	CodeCode Available	0	5
Distill the Best, Ignore the Rest: Improving Dataset Distillation with Loss-Value-Based Pruning	Nov 18, 2024	Dataset Distillation	CodeCode Available	0	5
Image Distillation for Safe Data Sharing in Histopathology	Jun 19, 2024	Dataset DistillationPrognosis	CodeCode Available	0	5
Going Beyond Feature Similarity: Effective Dataset Distillation based on Class-Aware Conditional Mutual Information	Dec 13, 2024	Dataset Distillation	CodeCode Available	0	5
Diversity-Driven Synthesis: Enhancing Dataset Distillation through Directed Weight Adjustment	Sep 26, 2024	Dataset DistillationDiversity	CodeCode Available	0	5
Discovering Galaxy Features via Dataset Distillation	Nov 29, 2023	Dataset Distillation	CodeCode Available	0	5
Dataset Distillation by Automatic Training Trajectories	Jul 19, 2024	Dataset Distillation	CodeCode Available	0	5
DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation	Mar 20, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	0	5
Exploring the Impact of Dataset Bias on Dataset Distillation	Mar 24, 2024	Dataset Distillation	CodeCode Available	0	5
Data-to-Model Distillation: Data-Efficient Learning Framework	Nov 19, 2024	Computational EfficiencyDataset Distillation	CodeCode Available	0	5
Boosting the Cross-Architecture Generalization of Dataset Distillation through an Empirical Study	Dec 9, 2023	Dataset DistillationInductive Bias	CodeCode Available	0	5
Enhancing Dataset Distillation via Non-Critical Region Refinement	Mar 24, 2025	Dataset DistillationTransfer Learning	CodeCode Available	0	5
Exploring Generalized Gait Recognition: Reducing Redundancy and Noise within Indoor and Outdoor Datasets	May 21, 2025	Dataset DistillationGait Recognition	CodeCode Available	0	5
Accelerating Dataset Distillation via Model Augmentation	Dec 12, 2022	Dataset Distillationmodel	CodeCode Available	0	5
Dataset Distillers Are Good Label Denoisers In the Wild	Nov 18, 2024	Dataset DistillationDenoising	CodeCode Available	0	5

Show:10 25 50

← PrevPage 2 of 5Next →

No leaderboard results yet.