SOTAVerified|Agents Browse Leaderboard About Blog

Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 216 papers

Title	Date	Tasks	Status	Score
Going Beyond Feature Similarity: Effective Dataset Distillation based on Class-Aware Conditional Mutual Information	Dec 13, 2024	Dataset Distillation	CodeCode Available	5
Dataset Distillation via Adversarial Prediction Matching	Dec 14, 2023	Dataset DistillationGPU	CodeCode Available	5
Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation	Mar 24, 2025	Dataset Distillation	CodeCode Available	5
Dataset Distillation using Neural Feature Regression	Jun 1, 2022	Continual LearningDataset Distillation	CodeCode Available	5
CONCORD: Concept-Informed Diffusion for Dataset Distillation	May 23, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	5
BACON: Bayesian Optimal Condensation Framework for Dataset Distillation	Jun 3, 2024	Dataset Distillation	CodeCode Available	5
Image Distillation for Safe Data Sharing in Histopathology	Jun 19, 2024	Dataset DistillationPrognosis	CodeCode Available	5
ATOM: Attention Mixer for Efficient Dataset Distillation	May 2, 2024	Dataset DistillationNeural Architecture Search	CodeCode Available	5
Dataset Distillation for Offline Reinforcement Learning	Jul 29, 2024	Dataset Distillationreinforcement-learning	CodeCode Available	5
Exploring Multilingual Text Data Distillation	Aug 9, 2023	Dataset DistillationFairness	CodeCode Available	5

Show:10 25 50

← PrevPage 8 of 22Next →

No leaderboard results yet.