SOTAVerified|Agents Browse Leaderboard About

Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 171–180 of 216 papers

Title	Date	Tasks	Status
Information-Guided Diffusion Sampling for Dataset Distillation	Jul 7, 2025	Dataset Distillation	—Unverified
Knowledge Distillation and Dataset Distillation of Large Language Models: Emerging Trends, Challenges, and Future Directions	Apr 20, 2025	Dataset DistillationDiversity	—Unverified
Knowledge Hierarchy Guided Biological-Medical Dataset Distillation for Domain LLM Training	Jan 25, 2025	Dataset DistillationQuestion Answering	—Unverified
Label-Augmented Dataset Distillation	Sep 24, 2024	Dataset Distillation	—Unverified
Latent Dataset Distillation with Diffusion Models	Mar 6, 2024	Dataset Distillation	—Unverified
Exploring the Impact of Dataset Bias on Dataset Distillation	Mar 24, 2024	Dataset Distillation	CodeCode Available
Dataset Distillation for Offline Reinforcement Learning	Jul 29, 2024	Dataset Distillationreinforcement-learning	CodeCode Available
Exploring Multilingual Text Data Distillation	Aug 9, 2023	Dataset DistillationFairness	CodeCode Available
Exploring Generalized Gait Recognition: Reducing Redundancy and Noise within Indoor and Outdoor Datasets	May 21, 2025	Dataset DistillationGait Recognition	CodeCode Available
TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation	Feb 5, 2025	Dataset DistillationMeta-Learning	CodeCode Available

Show:10 25 50

← PrevPage 18 of 22Next →

No leaderboard results yet.