SOTAVerified|Agents Browse Leaderboard About Blog

Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 216 papers

Title	Date	Tasks	Status	Score
Risk of Text Backdoor Attacks Under Dataset Distillation	Oct 17, 2024	Backdoor AttackDataset Distillation	CodeCode Available	5
Sequential Subset Matching for Dataset Distillation	Nov 2, 2023	Dataset Distillation	CodeCode Available	5
TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation	Feb 5, 2025	Dataset DistillationMeta-Learning	CodeCode Available	5
Teddy: Efficient Large-Scale Dataset Distillation via Taylor-Approximated Matching	Oct 10, 2024	Dataset Distillation	CodeCode Available	5
Towards Adversarially Robust Dataset Distillation by Curvature Regularization	Mar 15, 2024	Adversarial RobustnessDataset Distillation	CodeCode Available	5
Towards Mitigating Architecture Overfitting on Distilled Datasets	Sep 8, 2023	Dataset DistillationKnowledge Distillation	CodeCode Available	5
UniDetox: Universal Detoxification of Large Language Models via Dataset Distillation	Apr 29, 2025	Dataset DistillationLanguage Modeling	CodeCode Available	5
Towards Efficient Deep Hashing Retrieval: Condensing Your Data via Feature-Embedding Matching	May 29, 2023	Dataset CondensationDataset Distillation	—Unverified	0
Adaptive Dataset Quantization	Dec 22, 2024	Contrastive LearningDataset Distillation	—Unverified	0
Video Set Distillation: Information Diversification and Temporal Densification	Nov 28, 2024	Dataset Distillation	—Unverified	0

Show:10 25 50

← PrevPage 11 of 22Next →

No leaderboard results yet.