SOTAVerified|Agents Browse Leaderboard About

Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–60 of 216 papers

Title	Date	Tasks	Status	Hype
Towards Universal Dataset Distillation via Task-Driven Diffusion	Jan 1, 2025	Dataset Distillationimage-classification	—Unverified	0
Hierarchical Features Matter: A Deep Exploration of Progressive Parameterization Method for Dataset Distillation	Jan 1, 2025	Dataset Distillation	—Unverified	0
A Large-Scale Study on Video Action Dataset Condensation	Dec 30, 2024	Action RecognitionDataset Condensation	CodeCode Available	1
Distilling Desired Comments for Enhanced Code Review with Large Language Models	Dec 29, 2024	Dataset DistillationHallucination	—Unverified	0
Adaptive Dataset Quantization	Dec 22, 2024	Contrastive LearningDataset Distillation	—Unverified	0
Going Beyond Feature Similarity: Effective Dataset Distillation based on Class-Aware Conditional Mutual Information	Dec 13, 2024	Dataset Distillation	CodeCode Available	0
Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization	Dec 13, 2024	Dataset Distillation	—Unverified	0
Diffusion-Augmented Coreset Expansion for Scalable Dataset Distillation	Dec 5, 2024	Bilevel OptimizationComputational Efficiency	—Unverified	0
FairDD: Fair Dataset Distillation via Synchronized Matching	Nov 29, 2024	Dataset DistillationFairness	—Unverified	0
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation	Nov 29, 2024	Dataset DistillationDiversity	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 22Next →

No leaderboard results yet.